تعدين البيانات

ما هو تعدين البيانات:

استخراج البيانات هو مصطلح باللغة الإنجليزية يرتبط بعلوم الكمبيوتر وترجمته هي استخراج البيانات . وهو يتألف من وظيفة تجمع البيانات وتنظمها ، وتجد فيها الأنماط والجمعيات والتغييرات والشذوذ ذات الصلة.

ظهر مصطلح استخراج البيانات لأول مرة في عام 1990 في مجتمعات قواعد البيانات. استخراج البيانات هو خطوة تحليل العملية المعروفة باسم KDD ( اكتشاف المعرفة في قواعد البيانات ) ، وترجمتها الحرفية هي "اكتشاف المعرفة في قواعد البيانات".

يمكن تقسيم استخراج البيانات إلى بضع خطوات أساسية: الاستكشاف وبناء النماذج وتعريف الأنماط والتحقق من صحتها والتحقق منها.

يعد تعدين البيانات ممارسة حديثة نسبيًا في عالم الحوسبة ، ويستخدم استرجاع المعلومات والذكاء الاصطناعي والتعرف على الأنماط والتقنيات الإحصائية للبحث عن الارتباطات بين البيانات المختلفة التي تمكنك من اكتساب معرفة مفيدة لشركة أو فرد. بالنسبة لشركة ما ، يمكن أن يكون استخراج البيانات أداة مهمة تعزز الابتكار والربحية.

يعد استخدام التنقيب عن البيانات شائعًا جدًا في قواعد البيانات الكبيرة ، ويمكن عرض النتيجة النهائية لاستخدامها من خلال القواعد والفرضيات وأشجار القرارات وبرامج التشريح وغيرها.

يجب أن يؤدي التنقيب عن البيانات الذي يتم تنفيذه جيدًا إلى القيام بمهام مثل: اكتشاف الحالات الشاذة وتعلم قواعد الارتباط (نمذجة التبعية) والتكتل والتصنيف والانحدار والتلخيص. تحدث عملية استخراج البيانات عادةً باستخدام البيانات الموجودة داخل مستودع البيانات .

هناك العديد من الشركات والبرامج المخصصة لاستخراج البيانات ، حيث أن تحديد الأنماط في قواعد البيانات مهم بشكل متزايد. ومع ذلك ، فإن تحديد المعايير ذات الصلة ليس فريدًا في عالم الكمبيوتر. يستخدم الدماغ البشري عملية مماثلة لتحديد الأنماط واكتساب المعرفة.

في السنوات الأخيرة ، تم استخدام التنقيب عن البيانات على نطاق واسع في مجالات العلوم والهندسة مثل المعلوماتية الحيوية ، وعلم الوراثة ، والطب ، والتعليم ، والهندسة الكهربائية.

غالبًا ما يرتبط مفهوم استخراج البيانات باستخراج المعلومات حول سلوك الأشخاص. لهذا السبب ، في بعض الحالات ، يثير التنقيب عن البيانات قضايا قانونية وقضايا متعلقة بالخصوصية والأخلاق. على الرغم من ذلك ، يدعي العديد من الأشخاص أن استخراج البيانات محايد أخلاقياً لأنه لا تترتب عليه آثار أخلاقية.

أمثلة استخراج البيانات الحقيقية

غالبًا ما تستخدم الشركات والمؤسسات عمليات التنقيب عن البيانات لاكتساب المعرفة حول المستخدمين / الموظفين / العملاء. على سبيل المثال ، في القطاع العام ، يمكن التحقق من الحالة الاجتماعية للموظف والمرتب الذي يكسبه لمعرفة ما إذا كان لذلك تأثير على حياته الزوجية.

يمكن لشركات مثل سلاسل المتاجر الكبرى استخدام هذه البيانات المتقاطعة لتحديد المنتجات التي يتم شراؤها معًا. إذا كان العميل الذي يشتري المنتج X يشتري أيضًا المنتج ص ، فقد يكون من الجيد وضع المنتجين في مكان قريب لجعل العميل أسهل في الشراء.