الYOLO هو اختصار لـ “You Only Look Once”، وهو واحد من أهم وأشهر الmodels في مجال Computer Vision، وخصوصاً في Object Detection، اللي هي ببساطة تحديد أماكن الحاجات اللي في الصور، مثل العربيات، الناس، الكراسي…
أي كائن الفكرة الأساسية لـ YOLOYOLO بيشوف الصورة مرة واحدة بال models القديمة مثل R-CNN كانت بتقسم الصورة لأجزاء صغيرة (Regions) وتفحص كل جزء لوحده، وهذا ياخد وقت كبير جدًا.YOLO بقى مختلف، هو بيحلل الصورة كلها مرة واحدة كأنها شبكة مربعات (Grid)، وكل مربع بيشوف إذا كان فيه عنصر معين ولا لأ، وفي نفس الوقت بيرسم الصندوق حوالين العنصر (Bounding Box) ويحدد نوعه.
ليه YOLO مميز جدًا؟
1. سرعة خارقة:YOLO بيشتغل في الوقت الحقيقي (Real-Time)، هو مثالي للحاجات اللي محتاجة استجابة لحظية مثل autonomous vehicles أو smart camera
2. دقة عالية:لكن غير سريع، كمان دقيق جدًا في تحديد الأماكن وأنواع العناصر.
3. كل حاجة في model واحد:YOLO بيعمل Detection و Classification في خطوة واحدة، وهذا بيقلل التعقيد بشكل كبير.
إصدارات YOLOYOLO فيه منه إصدارات كتير، وكل إصدار فيه تحسينات جديدة.
YOLOv1: البداية الأساسية سنة 2016، كانت سريعة لكن الدقة عادية.
YOLOv2 و YOLOv3: تحسين في الدقة والسرعة، وبدأت تنتشر بشكل أكبر.
YOLOv4 و YOLOv5: أضافوا تحسينات قوية مثل تقليل الأخطاء وزيادة traning time
.YOLOv7 و YOLOv8: الإصدارات الأحدث حاليًا، فيها تطورات ضخمة مثل تقليل استهلاك الموارد وزيادة الكفاءة.
YOLO كيف بيشتغل ؟
1. الصورة بتتقسم لشبكة:
الصورة كلها بتتقسم لمربعات صغيرة (Grid)، وكل مربع يكون على جزء معين
2. التوقعات:
كل مربع بيتوقع:
نوع العنصر (زي عربية، كلب، إنسان).
مكانه (Bounding Box).
مدى الثقة في التوقع
3. اختيار الأفضل (NMS):
لو في أكتر من مربع متداخل، YOLO بيختار التوقع الأفضل باستخدام تقنية اسمها Non-Maximum Suppression.
YOLO في حياتنا اليوميةأنظمة المراقبة:
مثل الكاميرات اللي بتحدد الحركات المشبوهة.
التجارة الإلكترونية: مثل البحث عن منتجات من خلال الصور.
الرعاية الصحية: تحليل الأشعات الطبية لاكتشاف الأمراض.
#Artificial_Intelligence
#Lana_Ansari