چقدر باهوش هستید؟آیا راهی برای اندازه گیری هوش شما وجود دارد؟آیا در وهله اول یک روش واقعاً علمی برای اندازه گیری هوش وجود دارد؟کودکان چگونه داستان های خواب را درک می کنند؟چگونه مردم معماها را حل می کنند؟ماتریس راون به همه این سؤالات و موارد دیگر پاسخ می دهد!
Raven Matrices یک آزمایش گروه غیر کلامی است که معمولاً در تنظیمات آموزشی به عبارت دیگر استفاده می شود ، این یک آزمایش بسیار مؤثر از هوش انسانی عمومی است.
شکل زیر را در نظر بگیرید ، ما می خواهیم تصویری را پیدا کنیم که به بهترین وجه در قسمت خالی در بالا قرار داشته باشد.
در حالی که اگر از یک رویکرد از بالا به پایین استفاده کرده اید ، ممکن است برای شما آسان باشد. که در آن در نظر می گیریم که دو عنصر برتر در محور افقی منعکس می شوند و سپس عنصر پایین را منعکس می کنند. استفاده از یک رویکرد از پایین به بالا که فقط دیدن جواب در فضای خالی ظاهر می شود ، دشوارتر است. این رویکرد گشتالت یا مجسمه ای نامیده می شود.
بسته به شخصی که یک رویکرد یک رویکرد ممکن است آسان تر از دیگری به نظر برسد ، با این حال ، هر دو آنها شامل استدلال انتزاعی هستند. استدلال انتزاعی مشخصه ای از هوش انسانی محسوب می شود و از نظر رایانه بسیار پیچیده است.
پس چرا زحمت حل مشکلات ماتریس راون را دارید؟چنین مشکلاتی به محققان بینش در مورد پویایی سازمان اطلاعات و مدلهای مختلف محاسباتی که برای حل این مشکلات با توجه به عملکرد و رویکردها استفاده می شود ، می دهد.
نحوه یادگیری مدل های محاسباتی برای حل این مشکلات و عملکرد مدل های محاسباتی در مقایسه با عملکرد انسان ، بینش در مورد سازمان هوش ، چه در انسان و چه در سیستم های مصنوعی ، بینش می دهد و بنابراین ارزش قابل توجهی را برای تحقیقات دارد.
زمینه
در این پست ، ما می خواهیم نه تنها دنیای ماتریس های راون بلکه فضای نهفته را کشف کنیم. آزمایش ماتریس Raven تا به امروز در سراسر جهان شناخته شده و مورد استفاده قرار می گیرد. محققان و مهندسان قادر به تقلید از این شهود در دستگاه نیستند. چگونه مغز انسان قادر به حل چنین مشکلاتی بدون اعتراض به آن است و چگونه می توانیم همان منطق را برای رایانه پیاده سازی کنیم. در این پروژه ، ما یکی از راه های دستیابی به آن را مورد بررسی قرار دادیم. ایده اصلی استفاده از چیزی به نام فضای نهفته در یک مجموعه داده نسبتاً بزرگ و استفاده از این مجموعه داده برای ایجاد بردارها برای گفتن دستگاه صحیح است.
بیایید نگاهی به این مشکل Raven بیندازیم:
برای انسان ، جواب کاملاً واضح است ، درست است؟اما برای دستگاهی که قبل از این که فکر می کنید می توانند آن را حل کنند ، مشکلات Raven را عملی نکرده است؟نه!
حال تصور کنید که آیا این تصاویر یک مجموعه داده بوده است و ما از آنها برای تعریف بردارهای خاص استفاده می کنیم که به ما می گویند کدام تصویر را انتخاب می کنند ، اکنون برای دستگاه آسان تر است که جواب را نیز شناسایی کنید ، زیرا ما به معنای واقعی کلمه آن را مشخص می کنیم ، درست است؟
مثال دیگر در زیر نشان داده شده است:
با استفاده از فضای نهفته ، ما قادر به یافتن بردارهای صحیح هستیم که به دستگاه می گویند کدام تصویر را انتخاب می کند و از این رو به دستگاه اجازه می دهد بدون دیدن آن قبلاً چنین مشکلاتی را حل کند.
مواد و روش ها
- اول ، ما مجموعه داده های ماتریس مترقی Raven خود را تولید خواهیم کرد.
- دوم ، ما چندین AutoEncoder ایجاد خواهیم کرد: AutoEncoder ساده ، Autoencoder Convolutional ، Autoencoder متغیر و Autoencoder متنوع با لایه های حلقوی.
- سپس ، ما آن دسته از خودروها را مقایسه خواهیم کرد.
- سرانجام ، ما تصاویر را از فضای نهفته تولید خواهیم کرد.
تولید مجموعه داده
اول ، ما مجموعه ای را که می خواستیم روی آن کار کنیم تولید می کنیم. در این مرحله ، شکل ها و خطوط هندسی را انتخاب می کنیم. چرا؟از آنجا که ما در مورد این چهره های ساده در سنین بسیار جوانی می آموزیم ، بنابراین حل چنین مشکلاتی باید نسبتاً آسان در دستگاه باشد.
ایجاد AutoEncoders
ما نیاز به ایجاد AutoEncoders داشتیم تا بتوانیم یک شبکه عصبی را آموزش دهیم تا ویژگی های نهفته در مورد مشکل Raven را بیاموزیم ، و سپس هر بار که نیاز به حل یک مشکل Raven داریم و یک تصویر را انتخاب می کنیم ، در واقع می توانیم تصاویر مشکل را مطالعه کنیم و تولید کنیمبردارها و تصویر را انتخاب کنید.
صحبت کردن در مورد AutoEncoders به اندازه کافی AutoEncoders چیست؟!
AutoEncoders به طور شگفت آور معماری عصبی ساده است. آنها اساساً نوعی فشرده سازی هستند ، شبیه به نحوه فشرده سازی فایل صوتی با استفاده از MP3 ، یا یک فایل تصویری با استفاده از JPEG فشرده می شود.
در پروژه ما ، از 4 AutoEncoder مختلف استفاده کرده ایم: AutoEncoder ساده ، AutoEncoder Convolutional ، Autoencoder متغیر و AutoEncoder متنوع با لایه های حلقوی.
بیایید چهار مورد از آنها را مقایسه کنیم:
- Autoencoder ساده: آموزش آسانتر ، سریع ، پایدار ، اما برای کار با تصاویر و بد در رمزگذاری/رمزگشایی داده ها مناسب نیست.
- AutoEncoder Convolutional: برای کار با تصاویر مفید است ، اما در آموزش آن کندتر و فاقد ویژگی های خودروهای متغیر مانند توانایی تولید بازنمایی های نهفته جدا شده و توانایی تولید داده های جدید است.
- AutoEncoder متغیر: دقیقاً مانند AutoEncoder ساده ، آموزش ، سریع ، پایدار تر نیز آسان تر است و شناخته شده است که بازنمایی های نهفته تر از بین می رود و می تواند داده های جدیدی ایجاد کند. با این حال ، نقطه ضعف اصلی عدم وجود لایه های حلقوی است که برای کار با تصاویر مفید هستند.
- اتوآنمان متغیر با لایه های حلقوی: مزایای استفاده از AutoEncoder Convolutional و Autoencoder متنوع را دارد. با این حال ، آموزش بسیار کند و همچنین پایدار و قابل پیش بینی است. این امر به ویژه هنگامی که یک لایه متراکم اضافه کردیم قابل توجه بود و دقت آن به میزان قابل توجهی کاهش یافت.
بنابراین چرا ما با خودروهای متغیر با لایه های حلقوی حل و فصل شدیم
ما آن را انتخاب می کنیم زیرا برای کار با تصاویر مناسب تر است زیرا دارای خواص CAE و VAE است که در تئوری باید داده های کمتر درگیر تولید کند و قادر به تولید داده های جدید از فضای نهفته است. همچنین ، در آزمایشات ما ، این شبکه بهترین نتیجه را هنگامی که سعی کردیم بردارهای تحول را روی تصاویر اصلی اعمال کنیم.
تولید تصاویر
سرانجام ، با استفاده از AutoEncoders ما می توانیم بردارهای تصویری را بدست آوریم که بر اساس آن با موفقیت قادر به تولید تصاویر فشرده شده صحیح هستیم و سپس ما قادر به فشرده سازی آنها هستیم تا تصاویر صحیح نهایی را بدست آوریم و مشکل Raven را حل کنیم.
در تصویر بالا ، ما پاسخ صحیح را برای حل تست Raven مشاهده می کنیم. تصویر فوق نشان دهنده پیش بینی موفقیت آمیز است که خودروساز ما باید به طور دقیق تولید کند.
در تصویر بالا پیش بینی تصویر صحیح را ارائه می دهیم. این پیش بینی با استفاده از بردار تحول به تصویر داده شده (معمولاً ردیف سوم ، ستون اول) به دست آمد و سپس از رمزگشایی برای پیش بینی شکل استفاده کرد.
در تصویر فوق ، تصویر نهایی ، فشرده شده و سپس فشرده شده را مشاهده می کنیم که خودروهای متغیر ما با لایه های حلقوی پیش بینی می کند. این در واقع تصویر صحیحی است که مشکل Raven را حل می کند!
نتایج
ما توانستیم با تولید مجموعه داده های خود ، ماتریس های راون را با موفقیت حل کنیم و سپس AutoEncoder را ایجاد کنیم تا بردارها را در فضای نهفته تولید کنیم و سپس تصاویر را تولید کرده و آنها را فشرده سازیم تا با موفقیت تصاویر صحیح را برای حل ماتریس های Raven بدست آوریم.
از این رو ، ما می توانیم روش جدیدی را برای تقلید از هوش انسان به دستگاه آموزش دهیم و بتوانیم مشکلاتی مانند مشکلات راون را حل کنیم.
چالش های پروژه
در این پروژه ، ما با چالش های بسیاری مانند:
- استفاده از مشکلات 3x3 باعث می شود روند گرفتن بردارهای تحول فوق العاده سخت باشد.
- GANS کابوس برای توسعه بود. از آنجا که ما می خواستیم پروژه خود را تا حد ممکن تأیید کنیم ، می خواستیم GAN های خودمان را ایجاد کنیم ، که در آن شکست خورده ایم. چرا؟خوب ، GAN ها بسیار ناپایدار شناخته شده اند ، ما نمی توانیم آن را به درستی آموزش دهیم زیرا همیشه کلاس کاذب 100 ٪ صحیح و 100 ٪ دیگر اشتباه را پیش بینی می کرد.
- چند الگوی منظم از مدل های 3x3.
- چالش دیگر این است که ما تنگنا را خیلی باریک می کردیم و در نتیجه بازنمایی های نهفته بسیار درگیر شدند.
- سرانجام ، معماری رمزگذار/رمزگشایی بهترین نبود زیرا تصاویر فشرده شده مانند اصل به نظر نمی رسید.
مشارکت
Mohga: تحقیق در مورد GANS ، فضای نهفته ، ماتریس های Raven ، AutoEncoders و مجموعه داده های Raven ، اجرای GAN ها ، ارائه ، محتوای وبلاگ.
داریا: تحقیق در مورد AutoEncoders ، مجموعه داده ها ، Matercies Raven ، GANS ، اجرای AutoEncoders ، ارائه ، محتوای وبلاگ.
- AutoEncoder ما را می توان در اینجا یافت [autoencoder]
- مجموعه داده ما را می توان در اینجا یافت [DataSet]
- ارائه ما را می توان در اینجا یافت [ارائه]
منابع
- Miko laj ma lki´nski ، Jacek ma´ndziuk. یادگیری متضاد چند برچسب برای استدلال بصری انتزاعی. https://arxiv. org/pdf/2012. 01944. pdf
- Tianyu Hua1 ، Maithilee Kunda. مدل سازی استدلال بصری ژستالت در آزمون اطلاعاتی ماتریس مترقی Raven با استفاده از تکنیک های تولید کننده تصویر تولیدی. https://arxiv. org/pdf/1911. 07736. pdf
- Chi Zhang ، Feng Gao ، Baoxiong Jia ، Yixin Zhu ، Song-Chun Zhu. Raven: مجموعه داده برای استدلال بصری رابطه ای و آنالوگ. https://openaccess. thecvf. com/content_cvpr_2019/papers/zhang_raven_a_dataset_for_relational_and_analogical_visual_reasoning_cvpr_2019_paper. pdf
- Maithilee Kunda. هوش مصنوعی ، تصاویر بصری و یک مطالعه موردی در مورد چالش های ناشی از آزمایش های هوش انسانی. https://www. pnas. org/content/pnas/117/47/29390. full. pdf
- متیو استوارت ، مقدمه ای جامع برای AutoEncoders. https://towardsdatascience. com/generating-images-with-autoencoders-77fd3a8dd368
گزینه های باینری...
ما را در سایت گزینه های باینری دنبال می کنید
برچسب : نویسنده : سحر زکریا بازدید : 38 تاريخ : سه شنبه 3 مرداد 1402 ساعت: 14:46