
یادگیری نیمه نظارتی و آینده پردازش تصویر
توسعه دهندگان به طور مداوم توانایی هوش مصنوعی را با استفاده از روش های مختلف یادگیری ماشین مانند یادگیری تحت نظارت، بدون نظارت و تقویتی افزایش می دهند.
اخیراً، فیس بوک از یادگیری نظارت شده برای طبقه بندی تصاویر و ویدیوهای پیشرفته استفاده می کند. آنها رویکرد جدید خود را نظارت نیمه ضعیف می نامند، جایی که شرکت یادگیری نیمه نظارتی و یادگیری با نظارت ضعیف را برای دستیابی به معیار جدیدی در طبقه بندی تصاویر ترکیب کرد.
فیسبوک میبالد که روش آنها میتواند نتایج موثری را ارائه دهد، حتی زمانی که کمبود دادههای آموزشی برچسبگذاری شده با کیفیت بالا وجود داشته باشد.
پیشنهاد ویژه:
« اولین و کاملترین دوره آموزشی نرم افزار اودئون ODEON برای طراحی آکوستیک »
ثبت نام دوره آموزشی نرم افزار اودئون ODEON
نظارت نیمه ضعیف
فیس بوک با استناد به چندین اشکال مانند نویز ذاتی، برچسب های گم شده و نامربوط و غیره، در مدل های آموزشی با نظارت ضعیف، از الگوی آموزش الگوی معلم و دانش آموز استفاده کرد.
آنها از میلیاردها تصویر بدون برچسب همراه با مجموعه نسبتاً کوچکتری از داده های برچسب دار مخصوص کار استفاده کردند.
در ابتدا، آنها بر روی دادههای برچسبگذاری شده آموزش دیدند تا مدل معلمی به دست آورند. سپس از مدل معلم برای پیشبینی و رتبهبندی تصاویر بدون برچسب برای تعیین تصاویر برتر و ایجاد یک مجموعه داده جدید با دادههای فیلتر شده استفاده شد.
پس از آن، مجموعه داده جدید برای آموزش یک مدل دانشجویی استفاده شد. در نهایت، آنها دادههای دانشآموز را تنظیم کردند تا از خطای برچسبگذاری احتمالی با دادههای برچسبدار جلوگیری کنند.
منبع: فیسبوک
چنین روششناسی به توسعهدهندگان کمک میکند در صورت از دست دادن مجموعه دادههای نظارتشده، مدل میتواند دادههای جدیدی را از مجموعه دادههای بدون برچسب انتخاب کند تا مدل نیمهنظارتشده دقیقی ارائه کند.
در مجموع، این منجر به دقت 81.2٪ در ImageNet با استفاده از مدل RestNet-50 شد. و در طبقهبندی اکشن ویدیویی Kinetics، 74.2 درصد به دست آوردند که 2.7 درصد نسبت به مدل برتر قبلی بهبود یافته است.
منبع: فیسبوک
این فیس بوک را قادر می سازد تا مدل های آماده تولید با ظرفیت کم کارآمد ایجاد کند که دقت بالاتری را حتی با داده های کمتر و بدون نیاز به ظرفیت محاسباتی بالا ارائه می دهد.
برای شرکت ها چه معنایی دارد؟
امروزه، شرکتها اغلب سعی میکنند حجم عظیمی از دادهها را برای بهبود دقت مدلهای یادگیری ماشینی خود تغذیه کنند، اما نتیجه این است که آنها به منابع محاسباتی بالایی نیاز دارند.
علاوه بر این، آنها حتی برای جمعآوری دادههای مرتبط کافی برای آموزش و در نتیجه کاهش زمان عرضه محصولات به بازار تلاش میکنند.
با این حال، با نوآوری فیس بوک، آنها می توانند با داده های کمتر برچسب گذاری شده و منابع محاسباتی یکسان به نتایج بهتری دست یابند.
خلاص شدن از مدلهای یادگیری ماشینی مبتنی بر منابع نه تنها به سازمانها در کاهش پساندازهای عملیاتی کمک میکند، بلکه به آنها امکان میدهد برتری محصولات خود را افزایش دهند.
فاصله گرفتن از مجموعه داده های برچسب دار
میلیاردها چیز و اشیاء در جهان وجود دارد و نمی توان به صورت دستی به همه آنها برچسب زد. بنابراین، هرچه زودتر، کسبوکارها باید از تکنیکهای یادگیری ماشینی مرسوم دور شوند و روشهای جدیدی مانند یادگیری نیمهنظارتی را اتخاذ کنند.
به عنوان مثال، رویکرد نظارت هفتگی فیس بوک از تصاویر اینستاگرام برای آموزش مدل بر اساس برچسب های تصویر استفاده می کند.
اگرچه دقت پیشرفته ای را ارائه می دهد، اما چالش های زیادی برای آموزش مدل نظارت شده هفتگی مانند نویز برچسب زدن و نیاز به توان محاسباتی عظیم وجود دارد. در نتیجه، یادگیری نیمه نظارت شده فیس بوک یک راه حل موثر برای چنین مشکلاتی در یادگیری ماشین است.
پیشنهاد ویژه:
دوره آموزش ماژول آکوستیک ساختمانی نرم افزار کامسول
ثبت نام دوره آموزشی نرم افزار کامسول
چشم انداز
اگرچه مدل نظارت شده نیمه هفتگی بر مدل های کاملاً نظارت شده و با نظارت ضعیف برتری داشت، اما نمی توان نتیجه گرفت که یادگیری نیمه نظارتی بهترین راه پیش رو در طبقه بندی تصویر و ویدیو است.
چندین شرکت blue-chip (شرکت های پیشرو)در شبکههای عصبی پیشرفت کردهاند که مشکلات مربوط به محاسبات بالا و تصادفیسازی خودکار را کاهش دادهاند.
به عنوان مثال، تصادفیسازی دامنه خودکار OpenAI و برتری گوگل در محاسبات کوانتومی را میتوان در آینده نزدیک به طبقهبندی تصویر و ویدیو تعمیم داد. این نوآوری های جدید زمان آموزش را به شدت کاهش داده است و مدل ها را قادر می سازد در موقعیت های جدید حتی اگر با موقعیت خاصی آموزش ندیده باشند، تصمیم گیری کنند.
به طور قابل لمس، فیس بوک با ارائه بهترین نتایج تا کنون نشان خود را در پردازش تصویر گذاشته است. و می توان آن را یکی از بهترین راه ها برای طبقه بندی تصاویر و ویدئو با حداقل مجموعه داده ها و توان محاسباتی دانست.