اگر دادهها بررسي نشوند و از اين نكته اطمينان حاصل نشود كه دادهها به درستي وارد، ذخيره و پاكسازي شدهاند، كلانداده موجب بروز مشكلات كلان خواهد شد.
به گزارش شبکه خبری دولت الکترونیک, ممكن است دريافته باشيد شركتتان به يكي از مشتريان سابق كه درگذشته است ايميل ارسال ميكند و اين موجب ناراحتيتان شده باشد. ناچاريد اپراتور ثابتي را استخدام كنيد تا تمام روز دادهها را مجدداً به سيستمهاي نامنطبق و گوناگون وارد كند.
سازمانهاي دولتي بايد دادههاي مربوط به افراد مشكوك را بين خود ردوبدل كنند، اما يك نام جا ميافتد و يك بمبگذاري صورت ميگيرد. اين مثالها كه طيفي از نتايج منفي، از ناراحتي گرفته تا مرگ، را شامل ميشوند، مثالهايي از دادههاست كه بايد روزآمد و تلفيق و به اشتراك گذاشته ميشدند اما اين اتفاق نيفتاد.
افراد خارج از حوزۀ كسبوكارهاي مربوط به دادهها از اين موضوع شگفتزدهاند كه در عصر كلانداده، رايانش ابري، و سيستمهايي كه ظاهراً اطلاعات فراواني دربارۀ همه در اختيار دارند، هنوز مشكلات وخيمي در حوزۀ دادهها موجود است. افراد شاغل در صنعت پردازش دادهها از اين موضوع متعجباند كه اين مشكلات از آنچه امروز هست شايعتر نيستند.
در سمپوزيوم كيفيت اطلاعات و مسئوليت دادههاي MIT كه امسال از 17 تا 19 ژوييه در مؤسسه فناوري ماساچوست برپا شد، هم نمونههايي از موفقيت و هم نمونههايي از شكستها در اين حوزه معرفي شدند. امسال در هفتمين دوره از كنفرانس مذكور، تمركز بيشتر بر راهبردهاي كسبوكار براي ايجاد قابليت اتكا در دادهها بود. اين در حالي است كه در سالهاي گذشته اين كنفرانس بر توسعۀ رخداده در عرصۀ فناوريهاي پاكسازي، نرمالسازي و اطمينان از صحت دادههايي متمركز بود كه شركتها به آنها وابستهاند.
دبورا نايتينگل، مدير مركز تحقيقات سيستمهاي اجتماعي-فني MIT، در افتتاحيه كنفرانس مذكور گفت كه دشوارترين بخش نه فناوري، بلكه افراد و مسائل اجتماعي است. نايتينگل بر سيستمهاي فناوريهاي شركتي متمركز است و عموماً به سيستمهاي شركتي و نيز دادههايي ميپردازد كه براي قدرتبخشي به آن سيستمها به كار ميروند.
در دوراني كه كلانداده از از پديدهاي كمتر موردتوجه به شعار روز صنعت تبديل شده، دقت دادههاي زيرساختي سيستمها اغلب ناديده گرفته ميشود. اصطلاح “كلانداده” به گونهاي ويژه مورد توجه تقريباً 180 تن از شركتكنندگان در كنفرانس بود و سخنرانان مختلفي به اين نكته اشاره داشتند كه صنعت مذكور از پرداختن به دادههاي عمدتاً ساختارمند، به تركيبي از دادههاي ساختارمند و ناساختارمند روي آورده است.
پيچيدگي كار با انواع بسيار گوناگون دادهها و سيستمهاي متنوع و عموماً ناهمساز نيز از نكاتي بود كه دت تران، يكي از مسئولان تحليل داده در وزارت امور بازنشستگان امريكا به آن اشاره كرد. وي در توضيح دربارۀ مشكلات موجود بر سر راه مؤسسات بزرگ با حجم عظيم دادهها و مشتريان فراوان، اعلام كرد كه اين وزارتخانه محيطي از دادههاي تلفيقي در اختيار ندارد بلكه سيستمها و پايگاههاي دادهاي متعددي دارد و استانداردهاي دادههاي شركتي در اين وزارتخانه اعمال نميشود. به عبارتي، هيچ چشمانداز كامل و فراگيري از خدماتگيرندگان در اين وزارتخانه وجود ندارد.
وي افزود كه پاكسازي حجم ترافيك دادهها در وزارتخانۀ مذكور بيشتر شامل ايجاد توافق ميان گروههاي فني و حرفهاي در مورد برنامۀ زماني و پردازش كيفيت دادههاست، نه جستوجو براي يافتن راههاي فناورانۀ سريع براي حلوفصل مسائل.
از نظر اين متخصص، كيفيت داده يكي از مشكلات مشاغل است و ادارۀ امور دادهها به گونهاي مؤثر مستلزم همكاري مابين كاربران و بخش آيتي است.
در اين كنفرانس، بسياري از سخنرانان اين ايده را كه راه حل فناورانۀ سريعي براي اصلاح كيفيت دادهها وجود دارد شديداً رد كردند. كار دشوارِ برنامهريزي براي فرايندهاي كار، ايجاد احساس مسئوليت در قبال دقت دادهها در ميان كساني كه در وهلههاي نخست دادهها را وارد ميكنند، و ايجاد زيرساختي براي كيفيت دادهها كه متضمن حريم خصوصي باشد، همگي پيش از ابداع “كلانداده” و رواج آن به مثابه شعار روز وجود داشت. وجود دادههاي فراوانِ ناساختارمند در شركتها تنها موجب اهميتيافتنِ بيشتر كيفيت دادهها شده است.
به گفتۀ پيتر كائومي، مدير شركت حقوقي سوليوان و كرامول (Sullivan and Cromwell) با توجه به اهميت روزافزون ملاحظات امنيتي و حريم خصوصي، پاكسازي دادههاي داخلي بهدستآمده از منابع بيشمار به منزلۀ الگويي جديد رو به افزايش است.
مارك تمپل راستن، از مسئولان مديريت دادهها در سيتيگروپ (Citigroup) معتقد بود كه پيشرفت در پردازش زبان طبيعي كه در ارتباطات حرفهاي كاربرد دارد ميتواند بنياني مبتني بر رياضي براي دادهها فراهم آورد- بنياني كه اكنون موجود نيست.
يكي از عناوين بسيار مهم مطرح در اين كنفرانس نقش مدير ارشد دادهها در بهبود كيفيت دادهها بود اما روشن شد كه در مجموع، فرايندهاي كار، توان انتقال ارزش كيفيت دادهها و سپس راهاندازي روشهاي فناورانه، نخستين گام براي رسيدن به كيفيتي برتر در دادههاست.