DALL-E چیست؟ شگفتی هنری از یک هوش مصنوعی

4.8
(4)

ارتقا و پیشرفت هوش مصنوعی آرزوی همیشگی متخصصان و فعالان این حوزه بوده است. نه تنها افراد این حوزه بلکه مردم عادی هم رویای همزیستی انسان و ربات را در سر دارند. فیلم های هالیوودی همیشه نوید بخش این پیشرفت ها بوده اند. حالا هوش مصنوعی به نام DALL-E یک گام برای رسیدن به این رویا برداشته است. در ادامه این مقاله از سایت سئوف به آشنایی با این هوش مصنوعی میپردازیم.

DALL-E هوش مصنوعی خلاق

دال ای یک هوش مصنوعی هنرمند است که شرکت Open-AI آن را توسعه می‌دهد. نام این هوش مصنوعی از ترکیب نام هنرمند فرانسوی سالوادور دالی و شخصیت انیمیشنی WALL-E انتخاب شده است. هوش مصنوعی DALL-E قابلیت آن را دارد که با توجه به متنی که به او داده می‌شود تصاویر مشابه و شگفت انگیزی بسازد.

آپدیت هنری DALL-E

هوش مصنوعی دال ای در آغاز کار با اینکه بسیار خارق العاده عمل کرد اما درک تصاویر و خلاقیت هنری کمی داشت. DALL-E 2 در 20 ژوئیه سال 2022 وارد کار شد و انقلابی عظیم در عملکرد این هوش مصنوعی ایجاد کرد. روی کار آمدن این آپدیت باعث شد تصاویری که این هوش مصنوعی خلق میکند واقعگرایانه تر و خلاقانه تر باشد.

درباره نحوه طراحی DALL-E 2 گزارش شده:

DALL-E 2 رابطه بین تصاویر و متن مورد استفاده برای توصیف آنها را آموخته است. از فرآیندی به نام «نشر» استفاده می‌کند که با الگوی نقاط تصادفی شروع می‌شود. وقتی جنبه‌های خاصی از آن تصویر را تشخیص می‌دهد، به تدریج آن الگو را به سمت یک تصویر واضح تر و بهتر تغییر می‌دهد.

دال ای 2 دو جزئ اصلی برای طراحی و یادگیری خود دارد. یکی GPT-3 که مسلما پیشرفته‌ترین الگوریتم یادگیری ماشینی زبان طبیعی در دنیای امروزی است. بخش دوم از CLIP که مخفف “Contrastive Language-Image Pre-training” است، تشکیل شده است.

در زبان ساده CLIP یک عملکرد معکوس رایج یادگیری است. در حالت عادی هوش مصنوعی می‌کوشد تصویری که ارائه می‌شود را درک کند اما در اینجا DALL-E میکوشد تا متنی که به آن ارائه می‌شود را به تصویر تبدیل کند.

DALL-E mini چیست؟

این هوش مصنوعی درواقع الهام گرفته‌شده از هوش مصنوعی DALL-E است که توسط Boris Dayma طراحی شده و در اختیار عموم مردم گذاشته است. این هوش مصنوعی به دقت DALL-E اصلی عمل نمی‌کند ولی رسالت خود را به عنوان یک مبدل متن به عکس انجام داده است.

ما از سایت Craiyon برای نشان دادن یک مثال استفاده کردیم. در اینجا جمله “جادوگری سوار بر شیر بالدار در آسمان هنگام شب” را وارد کردیم و عکس های زیر نتیجه کار بود:

مثالی از یک تصویر ساخته شده توسط هوش مصنوعی DALL-E

هوش مصنوعی DALL-E طوری طراحی شده است که هر مقدار جزئیات بیشتری را برایش شرح دهید تصویری بهتر و نزدیک تر به تصویر مورد نظر شما طراحی میکند. برای مثال به تصویر زیر دقت کنید. ما جزئیات بیشتری مثل جنگل، کوه، جاده، غروب آفتاب، و پرنده را وارد کردیم و تصویر بهتر و منظم تری طراحی شد.

این تصویر نحوه عملکرد هوش مصنوعی DALL-E را نسبت به جزئیات متن شما نشان می‌دهد.

ارتقا و پیشرفت هوش مصنوعی مثل DALL-E می‌تواند پایانی برای هنرمندانی باشد که از راه هنر و طراحی امرار معاش می‌کنند. اما هیچ هوش مصنوعی دید بصری و فکری مثل انسان ندارد و همیشه مشتریانی خواهند بود که برای هنر دست انسان بهایی پرداخت کنند.

نگاهی به پدران DALL-E

GPT

ورژن اول و قدیمی ترین GPT، موظف به بهبود درک زبان بود. در ادامه و طی زمان ارتقا پیدا کرد و سر انجام Open AI هوش مصنوعی خود را که GPT-1 نام داشت معرفی کرد. اولین ورژن این نسل فقط و فقط قابلیت ترجمه جملات از یک زبان به زبان دیگر را داشت.

GPT-2

این شرکت در GPT-2 کار تحقیقات و ارتقا را تکمیل تر کرد و هوش مصنوعی با قابلیت تکمیل هوشمند جملات به صورت خودکار را به جهان عرضه کرد. درواقع این هوش مصنوعی توانایی حدس زدن درباره یک جمله ناقص و تکمیل آن را داشت.

GPT-3 آزمایش آینده ساز

زمانی که GPT-2 تکمیل شد و به موفقیت رسید چند مهندس پا را فراتر از مرزها گذاشتند. آنها این ایده را داشتند: حالا که میتوانیم جملات را تکمیل کنیم چرا دست به تکمیل تصاویر نزنیم؟ این ایده بسیار مورد توجه قرار گرفت و پس از مدتی آزمایش و تحقیق ثمره این تلاش مشخص شد. حالا هوش مصنوعی به دست آمده بود که یک عکس نصفه را به صورت خودکار و با تکیه به هوش خود تکمیل میکرد.

نمونه ای از تکمیل احتمالی تصاویر نصفه توسط GPT-3 پایه هوش مصنوعی DALL-E

بعد از تکمیل پروژه GPT-3 متخصصان تصمیم گرفتند هوش مصنوعی صفر تا صد یک تصویر را خودش بسازد. با وارد کردن تعریف چند سبک هنری و آپدیت کاملا قوی برای GPT-3 یک هوش مصنوعی خلاق متولد شد. اینگونه بود که برای اولین بار DALL-E وارد جهان دیجیتالی شد.

این مطلب چقدر مفید بود؟

از 1 تا 5 امتیاز بدید

درصد رضایت 4.8 / 5. تعداد رای: 4

1 نظر
  1. seof می گوید

    خوشحالیم مفید واقع شده

ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.