يجب إجراء فحص البيانات الضخمة ل Luhut Pandjaitan لتكون دقيقة

جاكرتا إن البيانات الضخمة التي قدمها وزير الشؤون البحرية والاستثمار لوهوت بنسار باندجايتان كمبرر لادعائه بأن غالبية مستخدمي الإنترنت في البلاد، في الوقت الحالي، يريدون تأجيل الانتخابات، تستحق التشكيك.

ليس فقط لأن لوهوت لم يرغب في الكشف عن محتويات البيانات الضخمة  التي ادعى أنها تحتوي على أصوات 110 ملايين مستخدم لوسائل التواصل الاجتماعي ، ولكن أيضا حول كيفية تفسير البيانات واختبارها بطرق مختلفة بحيث تكون الاستنتاجات المستخلصة صحيحة. مثل التوصل إلى استنتاج إذا كانت غالبية مستخدمي الإنترنت في إندونيسيا أكثر اتفاقا إذا تم تأجيل الانتخابات.

وفقا لألفا إروين ، المحاضر في دورات استخراج البيانات من الجامعة السويسرية الألمانية ، في القفز على الاستنتاجات حول البيانات الضخمة يجب أن تكون حذرا.

"لا ينبغي لنا أن نستخلص استنتاجات من مصدر واحد فقط. في طريقة البحث التي أجريت بشكل مثالي عبر الاختيار ، "قال إروين. "من الناحية المثالية يجب استخلاص الاستنتاجات من مصادر متعددة بحيث تكون دقتها مقبولة."

في حالة لوهوت ، فإن كيفية توصله إلى استنتاجات من البيانات الضخمة التي يزعم أنه كان يمتلكها غير واضحة أيضا ، لأن الوزير كان مترددا في شرح البيانات التي لديه.

"أعتقد أنه في القفز إلى استنتاجات حول البيانات الضخمة ، يجب أيضا التحقق منها. لا أعرف ما هي طريقته (لوهوت) في القفز إلى الاستنتاجات. لكن كل ذلك يجب أن يتم التحقق والتحقق المتبادل".

لسوء الحظ فقط ، لم يشرح لوهوت أبدا ما إذا كان قد تم التحقق من البيانات الضخمة واستنتاجاتها.

البيانات الضخمة نفسها وفقا لإروين هي مجموعة بيانات كبيرة ، مما يجعل من الصعب معالجتها مع البنية التحتية المملوكة. خصائص البيانات الضخمة هي أربعة ، الحجم ، السرعة ، التنوع ، الصدق.

ما هو الحجم إذا كانت البيانات كبيرة جدا ويصعب معالجتها. السرعة ، بسبب سرعة البيانات نفسها عند ظهورها. التنوع هو نوع معقد ونوع من البيانات. الصدق ،  العنصر الحقيقي أو غير الصحيح للبيانات. ثم هناك  أيضا ، البيانات منظمة وشبه منظمة وغير  منظمة.

"لا يوجد مقياس واضح لحجم هذه البيانات الضخمة. مجموعة من البيانات ، إذا كان من الصعب معالجتها مع البنية التحتية المملوكة ، فيمكن اعتبارها بيانات كبيرة ، "قال إروين.

يمكن الحصول على هذه البيانات الضخمة في المحادثات على وسائل التواصل الاجتماعي و Twitter و Facebook و Instagram وغيرها. وبالمثل ، يمكن أن تكون البيانات الإخبارية في وسائل الإعلام عبر الإنترنت والإذاعة والتلفزيون والتعليقات أحد المصادر لتصبح بيانات ضخمة.

"لا أعرف من أين حصل السيد لوهوت على البيانات الضخمة ، ربما لديه فريق وإمكانية الوصول إلى وسائل التواصل الاجتماعي . ولكن  عند القفز إلى الاستنتاجات ، يجب إجراء الفحص المتبادل ليكون أكثر دقة ويمكن حسابه لصحته "، قال إروين.