دسته‌بندی نشده

كيفيت داده ها اولين گام به سمت تحليل مطمئن داده ها

اگر داده­ها بررسي نشوند و از اين نكته اطمينان حاصل نشود كه داده­ها به درستي وارد، ذخيره و پاكسازي شده­اند، كلان­داده موجب بروز مشكلات كلان خواهد شد.

كيفيت داده ها اولين گام به سمت تحليل مطمئن داده ها

به گزارش شبکه خبری دولت الکترونیک, ممكن است دريافته باشيد شركت­تان به يكي از مشتريان سابق كه درگذشته است ايميل ارسال مي­كند و اين موجب ناراحتي­تان شده باشد. ناچاريد اپراتور ثابتي را استخدام كنيد تا تمام روز داده­ها را مجدداً به سيستم­هاي نامنطبق و گوناگون وارد ­كند.

سازمان­هاي دولتي بايد داده­هاي مربوط به افراد مشكوك را بين خود ردوبدل كنند، اما يك نام جا مي­افتد و يك بمب­گذاري صورت مي­گيرد. اين مثال­ها كه طيفي از نتايج منفي، از ناراحتي گرفته تا مرگ، را شامل مي­شوند، مثال­هايي از داده­هاست كه بايد روزآمد و تلفيق و به اشتراك گذاشته مي­شدند اما اين اتفاق نيفتاد.

افراد خارج از حوزۀ كسب­وكارهاي مربوط به داده­ها از اين موضوع شگفت­زده­اند كه در عصر كلان­داده، رايانش ابري، و سيستم­هايي كه ظاهراً اطلاعات فراواني دربارۀ همه در اختيار دارند، هنوز مشكلات وخيمي در حوزۀ داده­ها موجود است. افراد شاغل در صنعت پردازش داده­ها از اين موضوع متعجب­اند كه اين مشكلات از آنچه امروز هست شايع­تر نيستند.

در سمپوزيوم كيفيت اطلاعات و مسئوليت داده­هاي MIT كه امسال از ۱۷ تا ۱۹ ژوييه در مؤسسه فناوري ماساچوست برپا شد، هم نمونه­هايي از موفقيت و هم نمونه­هايي از شكست­ها در اين حوزه معرفي شدند. امسال در هفتمين دوره از كنفرانس مذكور، تمركز بيش­تر بر راهبردهاي كسب­وكار براي ايجاد قابليت اتكا در داده­ها بود. اين در حالي است كه در سال­هاي گذشته اين كنفرانس بر توسعۀ رخ­داده در عرصۀ ‌فناوري­هاي پاكسازي، نرمال­سازي و اطمينان از صحت داده­هايي متمركز بود كه شركت­ها به آن­ها وابسته­اند.

دبورا نايتينگل، مدير مركز تحقيقات سيستم­هاي اجتماعي-فني MIT، در افتتاحيه كنفرانس مذكور گفت كه دشوارترين بخش نه فناوري، بلكه افراد و مسائل اجتماعي است. نايتينگل بر سيستم­هاي فناوري­هاي شركتي متمركز است و عموماً به سيستم­هاي شركتي و نيز داده­هايي مي­پردازد كه براي قدرت­بخشي به آن سيستم­ها به كار مي­روند.

در دوراني كه كلان­داده از از پديده­اي كم­تر موردتوجه به شعار روز صنعت تبديل شده، دقت داده­هاي زيرساختي سيستم­ها اغلب ناديده گرفته مي­شود. اصطلاح “كلان­داده” به گونه­اي ويژه مورد توجه تقريباً ۱۸۰ تن از شركت­كنندگان در كنفرانس بود و سخنرانان مختلفي به اين نكته اشاره داشتند كه صنعت مذكور از پرداختن به داده­هاي عمدتاً ساختارمند، به تركيبي از داده­هاي ساختارمند و ناساختارمند روي آورده است.

پيچيدگي كار با انواع بسيار گوناگون داده­ها و سيستم­هاي متنوع و عموماً ناهمساز نيز از نكاتي بود كه دت تران، يكي از مسئولان تحليل داده در وزارت امور بازنشستگان امريكا به آن اشاره كرد. وي در توضيح دربارۀ مشكلات موجود بر سر راه مؤسسات بزرگ  با حجم عظيم داده­ها و مشتريان فراوان، اعلام كرد كه اين وزارت­خانه محيطي از داده­هاي تلفيقي در اختيار ندارد بلكه سيستم­ها و پايگاه­هاي داده­اي متعددي دارد و استانداردهاي داده­هاي شركتي در اين وزارت­خانه اعمال نمي­شود. به عبارتي، هيچ چشم­انداز كامل و فراگيري از خدمات­گيرندگان در اين وزارت­خانه وجود ندارد.

وي افزود كه پاكسازي حجم ترافيك داده­ها در وزارتخانۀ مذكور بيش­تر شامل ايجاد توافق ميان گروه­هاي فني و حرفه­اي در مورد برنامۀ زماني و پردازش كيفيت داده­هاست، نه جست­وجو براي يافتن راه­هاي فناورانۀ سريع براي حل­وفصل مسائل.

از نظر اين متخصص، كيفيت داده يكي از مشكلات مشاغل است و ادارۀ‌ امور داده­ها به گونه­اي مؤثر مستلزم همكاري مابين كاربران و بخش آي­تي است.

در اين كنفرانس، بسياري از سخنرانان اين ايده را كه راه حل فناورانۀ سريعي براي اصلاح كيفيت داده­ها وجود دارد شديداً رد كردند. كار دشوارِ برنامه­ريزي براي فرايندهاي كار، ايجاد احساس مسئوليت در قبال دقت داده­ها در ميان كساني كه در وهله­هاي نخست داده­ها را وارد مي­كنند، و ايجاد زيرساختي براي كيفيت داده­ها كه متضمن حريم خصوصي باشد، همگي پيش از ابداع “كلان­داده” و رواج آن به مثابه شعار روز وجود داشت. وجود داده­هاي فراوانِ ناساختارمند در شركت­ها تنها موجب اهميت­يافتنِ بيش­تر كيفيت داده­ها شده است.

به گفتۀ پيتر كائومي، مدير شركت حقوقي سوليوان و كرامول (Sullivan and Cromwell) با توجه به اهميت روزافزون ملاحظات امنيتي و حريم خصوصي، پاكسازي داده­هاي داخلي به­دست­آمده از منابع بي­شمار به منزلۀ الگويي جديد رو به افزايش است.

مارك تمپل راستن، از مسئولان مديريت داده­ها در سيتي­گروپ (Citigroup) معتقد بود كه پيشرفت در پردازش زبان طبيعي كه در ارتباطات حرفه­اي كاربرد دارد مي­تواند بنياني مبتني بر رياضي براي داده­ها فراهم آورد- بنياني كه اكنون موجود نيست.

يكي از عناوين بسيار مهم مطرح در اين كنفرانس نقش مدير ارشد داده­ها  در بهبود كيفيت داده­ها بود اما روشن شد كه در مجموع، فرايندهاي كار، توان انتقال ارزش كيفيت داده­ها و سپس راه­اندازي روش­هاي فناورانه، نخستين گام براي رسيدن به كيفيتي برتر در داده­هاست.

 

نمایش بیشتر

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا