ما ایرانیها، عادتهای خاص خودمان را داریم. نه! اصلاً نمیخواهم موضوع امروز را به قهقرا بکشم؛ ولی فکر میکنم شما هم با من همعقیده باشید که یکی از عادات خاص ما ایرونی جماعت، درآوردن گندِ هر چیزی است! امروز میخواهم از تصویرسازی با هوش مصنوعی برایتان بگویم؛ ابزار فناورانۀ جدیدی که حداقل در شبکههای اجتماعی خوب گندش را درآوردهایم؛ مثلاً صدای خوانندهای فاخر را طوری روی ترانۀ یک فالشخوان مونتاژ میکنیم تا مرحوم در گور بندری بزند. آری ما همانی هستیم که روزی سر عموی پیر خود را روی بدنی عریان و در کنار چند بانوی آنجوری فوتوشاپ میکردیم تا در جمع فامیل قاهقاه بخندیم.
اما اگر شما بهنوبۀ خودتان میخواهید میخی بر تابوتِ این رسمِ نامبارک بزنید و همینطور میخواهید بدانید که چرا و چطور باید با AI کار کنید تا هم خودتان راضی باشید هم شاید خدای ناکرده چند چوق به جیب بزنید، اصلاً و ابداً روی دکمۀ کلوز و بک کلیک نکنید!
تصویرسازی با هوش مصنوعی، تاریخچه، کاربردها و محدودیتها
دوست دارم در ابتدای کار، حجت را برای شما تمام کنم: شما امروز قرار نیست وقت خود را با تعاریف کلاسیک و طبقهبندیشده تلف کنید. اصلاً شاید در برخی مفاهیم اختلاف نظرهایی هم با یکدیگر داشته باشیم. این مقاله براساس تجربه و بهصورت کاربردی و عملی تنظیم شده است؛ پس به ما اعتماد کنید و همۀ نکات ریز و درشتی را که در لابهلای این متن میخوانید، جدی بگیرید. برای یادگیری همۀ این نکات در دورههای آموزشی، باید چند ده میلیون تومان هزینه کنید و دهها ساعت جور استاد بکشید.
تصویرسازی با AI فرایندی است که در آن، الگوریتمهای پیچیده هوش مصنوعی قادرند تصاویر واقعگرایانه یا هنری را براساس ورودیهای متنی یا تصویری تولید کنند. این فناوری، مرزهای خلاقیت را درنوردیده است و به کاربر امکان میدهد تا ایدههای خود را بهصورت بصری و با سرعت و دقت بسیار بیشتری به تصویر بکشد. شما از این ابزار حتی میتوانید برای تولید محتوا در اینستاگرام استفاده کنید که قواعد آن را پیشتر برایتان شرح دادهایم.
نحوۀ عملکرد تصویرسازی با هوش مصنوعی
اما ابزاری که امروزه بهصورت رایگان و پولی در اختیار ما است، چگونه این کار را انجام میدهد؟ در اخبار میخواندم که سه شرکت غول هوش مصنوعی مستقر در ایالات متحده برای پردازش و تحلیل دستورها بهاندازۀ پنجاه کشور جهان، برق مصرف میکنند. توجه داشته باشید که این نیاز در کمتر از سه سال برآورده شده است و هیچ مسئولِ کافرِ مستکبری به مردم خود نگفته است که مصرف خود را کاهش بدهید. تا ما را با گونی به ورزشگاه پرتاب نیزۀ اعراب منتقل نکردهاند باید بگوییم که AI برای تصویرسازی از دو متد اصلی زیر استفاده میکند:
- شبکههای عصبی: قلب تپنده این فناوری، شبکههای عصبی مصنوعی هستند که براساس ساختار مغز انسان طراحی شدهاند. این شبکهها با پردازش حجم عظیمی از دادههای تصویری، الگوها و ویژگیهای مختلف را یاد میگیرند.
- یادگیری ماشین: با استفاده از تکنیکهای یادگیری ماشین، این شبکهها قادر هستند روابط بین ورودیها (مثلاً یک عبارت متنی) و خروجیها (یک تصویر) را کشف و براساس این روابط، تصاویر جدیدی تولید کنند.
فریبکاری با هوش مصنوعی در وب فارسی
«از هوش مصنوعی خواستم تصویر فاتح جنگهای همۀ تاریخ را برایم ترسیم کند و او این تصویر حماسی و افتخارآمیز از کوروش کبیر را برایم نمایش داد» یا «از هوش مصنوعی خواستم تصویر رئیس جمهور آیندۀ ایران را پیشبینی کند و او تصویر شاهزاده پنجعلی غیرمعمولی را برایم کشید»! امیدوارم حداقل شما که علاقهمند به این حوزه یا احتمالاً در این حوزه مشغول به کار هستید، فریب تیترهای زرد اینچنینی را در شبکههای اجتماعی نخورده باشید. AI آن چیزی را ترسیم میکند که شما به او دستور میدهید.
بهجز محاسبات ریاضی که براساس منطق عمل میکنند، این ابزار، توانایی پیشبینی و پسبینیِ سرنوشت و گذشتۀ هیچ ملتی را ندارد. ابزارهای خلق تصاویر در بهترین حالت تنها با استفاده از دیتایی که از وب جمعآوری شدهاند، عمل میکنند. اگر ابزاری ساخته شود که قابلیت پیشگویی براساس نظریههای منطقی قدرتمندی مانند نظریه بازیها را داشته باشد به شما قول میدهم که همینجا آن را به شما معرفی کنم.
تاریخچۀ توسعه فناوری تصویرسازی با هوش مصنوعی
بهعنوان کسی که سالها است در حوزۀ تولید محتوا مشغول به کار هستم، اجازه بدهید تا حرفهای تکراری را که در همه جا با لحنهای مختلف مینویسند، کنار بگذارم و دقیقاً نظر خودم را برایتان بازگو کنم. کمی پساز معرفی میدجرنی که هنوز طفلی نوپا بود و برای همگان هم در دسترس نبود، ناگهان شرکت معظم ادوبی از قابلیتی پرده برداشت که حداقل من را در بسیاری از پروژهها جلو میانداخت.
Content-Aware Fill نام قابلیتی انقلابی بود که اکنون به عصای جداناپذیر دست طراحان گرافیک تبدیل شده است. درست است که نسخههای ابتدایی این ابزار، خیلی قبلتر هم در فوتوشاپ موجود بود؛ ولی من راجع به نسخه تکاملیافتۀ آن صحبت میکنم که باعث شد بسیاری از ما که هر روز با این نرمافزار سروکار داریم، انگشت به دهان، دامنها بدریم و سر به بیابان بگذاریم.
بهعنوانمثال، تقریباً در همۀ پروژهها، بخشهایی از تصاویر وجود دارند که ما نیاز به اصلاح یا حذف آن داریم. پیشتر این کار را پیکسل به پیکسل با کلون و دستکاری رنگ و سچوریشن و خواهش و تمنا انجام میدادیم. حالا اما حتی یادم نیست که چطور این کارها را که حالا با یک کلیک انجام میدهم، انجام میدادم.
اینها را گفتم تا برسم به معرفی فرزند خلف ادوبی یعنی مجموعۀ ابزاری با نام فایرفلای که مجموعۀ گستردهای از امکانات هوش مصنوعی فوتوشاپ است. این ابزار که بهلطف سردمدارانِ دلسوزمان هم فیلتر شده و هم خود او ما را تحریم و تنبیه کرده است، یکی از جذابترین ابزارهایی است که میتوانید با آن کار کنید.
تولید تصاویر از متن (تبدیل متن به تصویر، کنترل جزئیات تصویر، خلق تصاویر منحصربهفرد)، ویرایش تصاویر (حذف اشیا از تصویر، تغییر سبک تصاویر، بهبود کیفیت تصاویر)، ایجاد طرحهای گرافیکی (لوگو، پترن، بنر و پوستر) و … برخی از قابلیتهای فایرفلای هستند.
با گسترش قابلیتهای متنوع ابزارهای ادیت تصاویر با هوش مصنوعی و استقبال گستردۀ کاربران، روزبهروز بر تعداد سرویسهای مشابه افزوده شد که در لیست زیر، بهترینهای آن را برای شما معرفی کردهام:
- میدجرنی (Midjourney)؛
- دال-ای (DALL-E)؛
- استیبل دیفیوژن (Stable Diffusion)؛
- بینگ ایمیج کریتور (Bing Image Creator)؛
- لئوناردو (Leonardo.ai)؛
- ادوبی فایرفلای (Adobe Firefly).
شاید با خودتان بگویید این لیست ناقص است و ابزارهای معروف دیگری هم هستند که نامی از آنها به میان نیامده است! آری، من هم با شما موافقم؛ ولی هدف این مقاله، انتقال تجربههای شخصی در خلق تصاویر است. با یادگیری مستمر و همچنین آزمون و خطای فراوان، گوشت فیله کبابی در اختیارتان قرار میگیرد تا وقت گرانبهای شما، صرف پاککردن چربی و استخوان نشود؛ پس لطفاً ادامۀ این خوراک لذیذ را نوش جان کنید که هنوز به main course نرسیدهایم.
معرفی ابزارهای رایگان و تجاری
«پنیر مفت فقط توی تلۀ موشه». کافی است عبارت مشتقشده از هوش مصنوعی را در فروشگاههای اندروید و اپل جستوجو کنید تا با سیل عظیمی از اپلیکیشنهایی مواجه شوید که در بهترین حالت با استفاده از API همین سرویسهایی که در بخش پیشین معرفی کردیم، ساخته شدهاند. اگر آنها سوءقصدی به اطلاعات موبایل شما نداشته باشند، قطعاً با تبلیغات فراوان، اوقاتتان را تلخ خواهند کرد. بگذریم که بیشتر آنها، همین کار نصفه و نیمه را هم انجام نمیدهند و زامبیوار در حال بالابردن تعداد نصب خود هستند.
اگر میخواهید مشق و تمرین کنید با سرویس رایگان بینگ مایکروسافت شروع کنید. درغیراینصورت، حتماً یکی از سرویسهای پولی را خریداری کنید. توصیه میکنیم سراغ باتهای تلگرامی عمدتاً روسی هم نروید؛ زیرا همانطور که گفتیم: «پنیر مفت فقط توی تلۀ موشه».
کاربردهای تصویرسازی با هوش مصنوعی
یکی از کاربردهای جذاب این فناوری، تبدیل مستقیم متن به تصویر است. شما میتوانید هر آنچه را که به آن فکر میکنید به تصویر بکشید و از آنها برای مقاصد تجاری و شخصی خودتان استفاده کنید. برخی از کاربردهای تصویرسازی با هوش مصنوعی عبارتاند از:
- طراحی گرافیکی: ایجاد لوگو، پوستر، بنر و سایر عناصر بصری برای تبلیغات و برندسازی؛
- تولید محتوا: ساخت تصاویر برای وبسایتها، شبکههای اجتماعی و بلاگها؛
- بازیهای ویدیویی: تولید شخصیتها، محیطها و جلوههای ویژه؛
- انیمیشن: ساخت انیمیشنهای کوتاه و بلند؛
- مد و فشن: طراحی لباس و اکسسوری؛
- معماری: ایجاد رندرهای سه بعدی از ساختمانها و فضاها؛
- هنر دیجیتال: خلق آثار هنری منحصربهفرد و تجربی؛
- آموزش: ساخت تصاویر آموزشی و کمکآموزشی؛
- بازاریابی و تبلیغات: تولید تصاویر تبلیغاتی برای محصولات و خدمات و همچنین بازاریابی محتوایی.
- توسعه تحقیقات علمی: استفاده در تحقیقات پزشکی، نجوم و سایر حوزههای علمی.
محدودیتهای تصویرسازی با هوش مصنوعی
همانطور که احتمالاً به ذهن درصد بسیار کمی از شما هم خطور کرده است، این ابزار میتواند زمینههایی را هم برای انواع و اقسام سوء استفاده فراهم کند؛ اما خطابم با همان درصد کم است: شکم خود را صابونمالی نکنید؛ چون تقریباً همۀ راهها برای هرگونه اعمال منافی عفت، شرع و قانون بسته است و اِرور میدهد!
البته برخی از مخاطبان باهوش ما هم ممکن است بپرسند خب خودت چطور این را میدانی؟ خب باید بگویم که اولاً من هم آدمیزادم و کنجکاو؛ ولی راستش را بخواهید در تفهیم موضوعات به این موجودِ بیجانِ هوشمند، معمولاً خیلی به سوءتفاهم برمیخورم. کافی است از آنها بخواهید تصویری خشونتآمیز بیافرینند که مثلاً یک کودک هم دست بر قضا، شاهد آن ماجراست! این دستور فوراً بلاک میشود. آری ما ایرونی جماعت حتی در تصویرسازی با هوش مصنوعی هم خوششانس نیستیم و نمیتوانیم آزادی را ولو از نوع مَجازیاش تجربه کنیم.
برخی از این محدودیتها عبارتاند از:
- تولید محتوای مستهجن یا پورنوگرافی: تولید هرگونه تصویری که حاوی محتوای جنسی صریح، کودکآزاری یا هرگونه سوء استفاده جنسی باشد، بهشدت ممنوع است.
- تولید محتوای خشونتآمیز: تولید تصاویر خشونتآمیز، نفرتانگیز یا تحریکآمیز علیه گروههای خاص، نژادها، ادیان یا اقلیتها ممنوع است.
- تولید تصاویر جعلی: تولید تصاویر جعلی که به قصد فریب دادن دیگران یا ایجاد آشوب اجتماعی منتشر شود، غیرقانونی است. این شامل ایجاد تصاویر جعلی از افراد مشهور، سیاستمداران یا رویدادهای مهم میشود.
- تولید تصاویر متقلبانه: تولید تصاویر متقلبانه که میتواند به حقوق مالکیت معنوی دیگران لطمه بزند، مانند تولید تصاویر جعلی از آثار هنری یا محصولات تجاری، ممنوع است.
- تولید تصاویر نژادپرستانه یا تبعیضآمیز: تولید هرگونه تصویری که به نژاد، جنسیت، مذهب یا قومیت خاصی توهین یا آنها را تحقیر کند، ممنوع است.
دلایل این محدودیتها:
- حفاظت از کودکان: جلوگیری از تولید و انتشار محتوای سوء استفاده از کودکان؛
- حفاظت از حقوق افراد: جلوگیری از انتشار تصاویر جعلی و افتراآمیز؛
- حفاظت از جامعه: جلوگیری از ایجاد آشوب و تنش در جامعه؛
- حفاظت از حقوق مالکیت معنوی: احترام به حقوق هنرمندان و صاحبان آثار هنری.
تاکنون به کلیات موضوع اشاره کردیم. در ادامه، موضوعات جالبتری در انتظار شما است.
درآمدزایی از خلق تصاویر با هوش مصنوعی
راستش را بخواهید تا تنور داغ است باید خمیر را به آن بچسبانید. تا تبوتابِ استفاده از این ابزار نخوابیده است، دست به کار شوید و از هر راهی که میتوانید به درآمدزایی از آن فکر کنید. برخی از راههای کسب درآمد از ساخت تصاویر با هوش مصنوعی در ادامه برای شما بیان شده است:
- فروش مستقیم آثار:
- پلتفرمهای فروش آثار هنری: میتوانید آثار هنری خود را در پلتفرمهای آنلاین مانند Etsy، ArtStation یا حتی وبسایت شخصیتان به فروش برسانید.
- نمایشگاههای هنری: شرکت در نمایشگاههای هنری آنلاین یا آفلاین میتواند به شما کمک کند تا آثار خود را به جمعی از علاقهمندان هنر معرفی کنید.
- سفارشهای شخصی: با تبلیغ مهارتهای خود، میتوانید سفارشهای شخصی برای طراحی لوگو، پوستر، بنر و سایر موارد گرافیکی دریافت کنید.
- ایجاد محصولات فیزیکی:
- چاپ روی لباس: میتوانید تصاویر ایجادشده توسط هوش مصنوعی را روی تیشرت، هودی، کلاه و سایر محصولات پوشیدنی چاپ کنید و آنها را به فروش برسانید.
- چاپ روی لوازم خانگی: تصاویر شما میتوانند بر روی قاب گوشی، لیوان، پوستر و سایر لوازم خانگی چاپ شوند.
- ایجاد آثار هنری فیزیکی: میتوانید آثار خود را بر روی بوم یا کاغذ چاپ کنید و آنها را به صورت فیزیکی به فروش برسانید.
- همکاری با کسبوکارها:
- طراحی لوگو و هویت بصری: بسیاری از کسبوکارهای کوچک و بزرگ به دنبال طراحی لوگو و هویت بصری منحصر به فرد هستند.
- تولید محتوا برای شبکههای اجتماعی: میتوانید تصاویر جذاب و خلاقانهای برای شبکههای اجتماعی کسبوکارها تولید کنید.
- طراحی محصولات: میتوانید با شرکتهای تولید محصولات همکاری کرده و طرحهای خود را بر روی محصولات آنها پیادهسازی کنید.
- ایجاد دورههای آموزشی:
- آموزش استفاده از ابزارهای هوش مصنوعی: میتوانید دورههای آموزشی آنلاین برای آموزش استفاده از ابزارهای مختلف تولید تصویر با هوش مصنوعی ایجاد کنید.
- آموزش تکنیکهای هنری: میتوانید دورههایی برای آموزش تکنیکهای هنری و خلاقیت در استفاده از هوش مصنوعی برگزار کنید.
- ایجاد NFT:
- فروش آثار هنری به صورت NFT: میتوانید آثار هنری خود را به صورت توکنهای غیرقابل تعویض (NFT) در بازارهای NFT به فروش برسانید.
آموزش تصویرسازی با هوش مصنوعی
حالا که تا اینجا با ما همراه شدید به بهترین بخش ماجرا میرسیم؛ یعنی آموزش عملی تصویرسازی با هوش مصنوعی. در یکی از پروژههای محتواتراپی، نیاز داشتیم تا روزانه برای 6 مقاله تصویر بسازیم. برای تولید این تعداد تصویر، چالشهای بسیاری را پشت سر گذاشتیم. یکی از مهمترین این چالشها، نیاز به خلقِ تصاویر غیرهمسان و غیرمشابه برای تعداد زیادی مقاله بود. پساز اجرای موفق این پروژه که البته همچنان هم روند آن ادامه دارد بر آن شدیم تا تجربههای خودمان را با شما به اشتراک بگذاریم.
در وهلۀ نخست باید بگوییم که سرویسهای تصویرسازی با هوش مصنوعی، بهخصوص همانهایی که در ابتدای مقاله معرفی کردیم، اکنون به بلوغ کامل رسیدهاند. در جریان باشید که اگر شما نمیتوانید تصویر موردنظرتان را خلق کنید، حتماً پرامپتنویسی مناسبی انجام ندادهاید. این سرویسها بسیار قدرتمند هستند، بهشرطی که:
- بدانید دقیقاً چه میخواهید؛
- منظور خود را دقیق و واضح به هوش مصنوعی بفهمانید.
اما برای اجرای همین دو هدف، باید ابتدا با مهمترین مراحل خلق تصاویر با هوش مصنوعی آشنا شوید.
مراحل اصلی تولید تصاویر با AI
میگویند برای شروع یک کار باید از زمین خاکی شروع کرد. حالا وقت واردشدن به این زمین است. زنگوله را بزنید و میل و کباده را به دست بگیرید که مرشد مینوازد:
آشتی با زبان انگلیسی
اگر میخواهید سکان پروژههای پولساز و حرفهای را به دست بگیرید، تسلط بر زبان انگلیسی، اولویت نخست خواهد بود. سعی کنید با این زبان آشتی کنید. یک بار برای همیشه پروندۀ این داستان را ببندید. نیازی به گرفتن مدرک آیلتس و تافل ندارید! اینجا در دنیای واقعی، تنها باید بتوانید آموختههایتان را به کار بگیرید.
مدلهای هوش مصنوعی عمدتاً براساس زبان انگلیسی کار میکنند. اگرچه آنها در درک زبان فارسی عاجز نیستند؛ اما زبان انگلیسی بهترین روش تعامل و گفتوگو با آنها است. برای شروع کار میتوانید از ابزارهای مترجم آنلاین گوگل و مایکروسافت استفاده کنید و لنگان خرک خویش به منزل برسانید؛ اما برای اینکه شوالیهوار، سوار بر اسبِ تروبرد به منزل برسید، حتماً یک بار برای همیشه، یادگیری زبان انگلیسی را در دستور کار خودتان قرار بدهید.
پرامپتنویسی
پرامپت در واقع یک دستورالعمل یا درخواست است که به یک مدل هوش مصنوعی داده میشود تا یک کار خاص را انجام بدهد. در زمینه تولید تصویر با هوش مصنوعی، پرامپتها معمولاً عبارات یا جملاتی هستند که به مدل میگوییم تا چه نوع تصویری تولید کند. به زبان سادهتر، پرامپت همان چیزی است که به مدل هوش مصنوعی میگوییم تا بداند چه کاری از او میخواهیم. این موضوع مهمترین بخش ماجرا است که حسابی با آن سروکار خواهیم داشت.
تعیین هدف
اگر بهدنبال خلق یک تصویر هستید، باید موضوع اصلیتان را دقیقاً مشخص کنید و ابتدا آن را با حروف الفبا روی یک کاغذ بنویسید. هدف شما میتواند همان کلمۀ کلیدی شما باشد. این بخش، آسانترین مرحله از این فرایند است. اگر روند کارمان را مانند آغاز نقاشیکردن تصور کنیم، این مرحله، همان مرحلۀ اسکیس یا اسکچ در نقاشی است؛ مثلاً برای ترسیم سر یک انسان، کافی است ابتدا یک بیضیِ عمودی را رسم کنید. با این کار، ترکیب و فرم اصلی چیزی که میخواهید، شکل میگیرد.
طوفان فکری
هنگامی که مرحلۀ پیشین را انجام دادید به یک چارچوب کلی دست پیدا کردهاید. خجالت را کنار بگذارید؛ زیرا قرار نیست کسی به شما نمره بدهد! هر آن چیزی را که راجع به کلمۀ کلیدی یا موضوع اصلیتان به ذهنتان خطور میکند، بنویسید. نگران نباشید، در پایان این مرحله، میتوانید مواردی را که نمیپسندید، حذف کنید.
یاد یک شعرِ سخیفِ قدیمی افتادم که خواننده میخواند: «نیمکت گیتار پاییز مهتاب میمونم نمیای میمیرم. ساعت دیوار چشمات قلبم نمیای نمیای نمیای». آری راهش همین است. همینطور واژهسرایی کنید؛ مردم با این واژهسراییها روی صحنۀ اجرا رفتهاند، شما که جایگاه خودتان را دارید.
خیالپردازی
بنا به نظر شخصیام، این مرحله مهمترین بخش از فرایند پرامپتنویسی است. من همیشه پیشاز شروع نوشتن یک پرامپت، چشمهای خودم را میبندم و موضوع را تجسم میکنم. اگر شما نتوانید آنچه را که میخواهید بیان کنید، احتمالاً نتیجۀ مناسبی دریافت نخواهید کرد؛ پس چشمهای خود را ببندید و چیزی را که میخواهید، همراه با جزئیاتش، تصور و تخیل کنید. برای این کار میتوانید از واژههایی که در مرحلۀ قبل ساختهاید، کمک بگیرید.
سرقت غیرمسلحانه
نه نه! اصلاً قصد تشویق به اعمال مجرمانه ندارم، بلکه میخواهم بدانید که شما قرار نیست چرخ را دوباره اختراع کنید. منابع بسیاری وجود دارند که شما میتوانید با مراجعه به آنها از حاصل دسترنج دیگران بهرهمند شوید. گروهها، کانالها، وبسایتها و سرویسهایی وجود دارند که پرامپتهای آماده را در اختیار شما قرار میدهند. البته برخی رایگان هستند و برخی هم پولی.
یکی از منابعی که خودم برای شروع خیلی از آن استفاده کردهام، سرویس اسنک پرامپت است. شما در این وبسایت میتوانید با سبک و سیاق پرامپتنویسی آشنا شوید. میان انبوهی از تصاویر، اسکرول کنید و دستوری را که منجر به خلق آن تصویر شده است، ببینید. حالا میتوانید با کمی دستکاری در آن، نتایج شخصیسازیشدۀ خودتان را بیافرینید.
مهندسی معکوس
یکی دیگر از کارهای ما ایرانی جماعت، همین مهندسی معکوس است. شاید ما نتوانستهایم در راستای گسترش مرزهای دانش گام مهمی برداریم؛ اما میتوانیم کپی کنیم. از پوشک گرفته تا موشک و خودروی تسلا، همه را کپی میکنیم و به آن میبالیم؛ پس چرا در تصویرسازی با هوش مصنوعی این کار را نکنیم؟ برای انجام این کار، دو روش در پیش دارید:
- تصویری را که پسندیدهاید، ذخیره کنید. حالا آن را به سرویسی که قابلیت ایمپورت رفرنس دارد، بدهید و از او بخواهید تصویری با همان سبک و سیاق برای شما تولید کند.
- از یک هوش مصنوعی بخواهید یک تصویر را برای شما توصیف کند. سپس دست در توصیف او ببرید و اصلاً هم کم نگذارید. دست شما میتواند تا بینهایت در حلقوم این موجودِ بیجان فرو برود.
پرواز بینسیارهای
فرض کنید با یک موجود بیگانه یا همان آدمفضایی روبهرو شدهاید. شما برای برقراری ارتباط با او چه روشی پیشنهاد میدهید؟ من از یک مترجمِ زبانِ آدمفضایی کمک میگیرم! شاید فکر میکنید شوخی میکنم؛ ولی این روش واقعاً کار میکند. اگر نمیتوانید پرامپت بنویسید از یک هوش مصنوعی دیگر برای ارتباط با جنریتور تصاویر خودتان کمک بگیرید. بهسراغ سرویسی مانند بینگ بروید و از او بخواهید که فضایی با هدف شما ترسیم کند. حالا همین خروجی را به یک سرویس تولید تصویر بدهید و از خروجی کار لذت ببرید.
خوراکی با طعم صفر و یک
بگذارید یک بار دیگر هم برایتان از اخلاق ایرانی جماعت بنویسم. قول میدهم که این آخرین باری است که این کار زشت را مرتکب میشوم. شنیدههایی مبنی بر فراخی نشیمنگاه برخی هموطنانِ عزیزمان وجود دارد که البته من اهالی آن دیار را به زیبایی صورت و خوشیِ سیرتشان میشناسم. میخواهم این منش را به همۀ ساکنان کشور عزیزمان تعمیم بدهم. بگذارید روراست باشیم، همۀ ما ایرانیان کمی بیشازحد معمول به تنبلی گرایش داریم؛ پس چرا برای همین قشر تنبل هم کاری نکنیم و بهقول بیل گیتس از همین خصلت تنبلی برای انجام کارهای سخت استفاده نکنیم؟
برخی از سرویسهای تصویرسازی با AI یک خوراک یا رفرنس بهصورت تصویری از شما تحویل میگیرند و مشابه همان را به شما تحویل میدهند. میدجرنی و لئوناردو، استادِ این نوع تصویرسازی هستند. البته هنوز برخی از قابلیتهای پیشرفتۀ لئوناردو در لحظۀ نگارش این مقاله بهصورت coming soon است.
دایرۀ واژگان و اصطلاحات
بگذارید خیلی رک و پوستکنده موضوع بسیار مهمی را برایتان روشن کنم. برای اینکه بتوانید تصاویر استثنایی را خلق کنید، باید با اصطلاحات دقیق آن حوزه آشنا باشید. فرض کنید از یک هوش مصنوعی میخواهید برای شما تصویری رمانتیک از یک قایق بر روی آب را خلق کند؛ اما صبر کنید! منظور شما از قایق چیست؟ ما در زبان فارسی دو واژه بسیار کلی برای وسیلۀ نقلیۀ روی آب داریم؛ قایق و کشتی؛ اما آیا میدانید که واقعاً چند مدل کشتی و چند مدل قایق با کاربردها و ابعاد و اشکال مختلف وجود دارند که هرکدام، نام مخصوص به خود را نیز دارند؟ به نامها و تعریف چند مدل قایق توجه کنید:
Small Boats:
- Rowboat: A small boat propelled by oars.
- Canoe: A narrow, lightweight boat propelled by paddles.
- Kayak: A small, narrow boat propelled by a double-bladed paddle.
- Dinghy: A small boat often used for recreational purposes or as a tender for larger boats.
Larger Boats:
- Sailboat: A boat propelled by sails.
- Yacht: A large, luxurious sailboat or motorboat.
- Motorboat: A boat propelled by a motor.
- Houseboat: A boat designed to live on, often equipped with living quarters.
Commercial Boats:
- Fishing Boat: A boat used for fishing.
- Cargo Ship: A large ship used to transport goods.
- Cruise Ship: A large passenger ship used for vacations.
- Ferry: A boat used to transport people and vehicles across bodies of water.
Other Types:
- Submarine: A boat that can operate underwater.
- Speedboat: A fast motorboat.
- Tugboat: A powerful boat used to tow ships and other vessels.
سخت شد! نه؟ آری! یکی از جاهایی که قرار است شما را از دیگران متمایز کند، دانستن همین نکتۀ مهم است؛ مثلاً اگر میخواهید به هنر دیوارنگاری اشاره کنید، باید اصطلاح دقیق آن را بدانید که میشود هنر گرافیتی (Graffiti)؛ یعنی نوشتن عبارت نقاشی روی دیوار به نتیجه موردنظرتان ختم نخواهد شد. یا اگر میخواهید کابین یک خلبان را توصیف کنید باید نام آن را دقیقاً بدانید که میشود کاکپیت (cockpit). یک مثال خوب دیگر جنگل است. اگر فکر میکنید میتوانید از عبارت jungle استفاده کنید، باید بدانید چیزی که ما ایرانیها بهعنوان جنگل میشناسیم، Rainforest است.
مهمترین تکنیکهای پرامپتنویسی برای تصویرسازی با هوش مصنوعی (کدهای تقلب)
حالا به جذابترین بخش ماجرا رسیدید؛ زیرا قرار است لقمههایی آماده را نوش جان کنید که من برای بهدستآوردن آنها، شش ماه آزگار، دو چشم و همان یک گردنِ باریکم را نه که از دست بدهم؛ اما فشاری در حد چند صد پاسکال بر آنها وارد کردم. این شما و این مهمترین تکنیکهای پرامپتنویسی که حتماً باید از آنها استفاده کنید:
- شرح سوژه اصلی: سوژه اصلی شما در تصویر میتواند یک موجود جاندار یا بیجان باشد. مانند یک انسان یا یک خودرو؛ آن را بهخوبی توصیف کنید. سوژه جاندار در حال انجام چه کاری است؟ سوژۀ بیجان در حال رقم زدن چه اتفاقی است؟
- شرح صحنه: در صحنۀ مدنظر شما چه میگذرد؟ چه اتفاقی در حال وقوع است؟ سوژه چه ارتباطی با سایر اجزای تصویر دارد؟
- کاراکتر: نام، سن، لباس، نژاد، رنگ، احساسات، تعداد و هر جزئیاتی را که به کاراکتر مربوط است، دقیقاً بیان کنید.
- سبک عکاسی: تصویر مورد نظر شما با چه سبکی عکاسی شود؟ پرتره، طبیعت، حیاتوحش، محصول، ماکرو، خبرنگاری و ….
- دوربین: در مورد دوربین جزئیات بسیاری وجود دارد که میتواند تصویر شما را منحصربهفرد کند:
- ماهیت دوربین (نگاتیو، دیجیتال، گوپرو و …)؛
- برند و مدل دوربین؛
- فاصله کانونی و عمق میدان؛
- سرعت شاتر (از کند تا سریع)؛
- لنز دوربین (واید و تله، فیشآی و …)؛
- دیافراگم.
- سبک ساخت (ژانر): اگر کمی اهل فیلم و سینما باشید، ژانر تصویر موردنظرتان را درخواست کنید؛ مثلاً دراماتیک، تراژیک، ورزشی، فانتزی، ترسناک، کمدی و ….
- سبک تصویر: ترجیح میدهید تصویر شما در کدامیک از این سبکها بگنجد؟ واقعی، دوبعدی، سهبعدی، طراحی (اسکچ)، ایلاستریشن، انیمیشن و ….
- نورپردازی: شامل موارد زیر:
- یک طرفه، حلقهای، رامبرلاند، پروانهای و …؛
- جهت نور؛
- رنگ نور؛
- شدت نور؛
- کیفیت نور.
- ترکیب رنگ تصویر: میتوانید کد رنگ یا پالت رنگی تعریف کنید یا حتی تم خاصی را فرمان بدهید.
- صاحب سبک، صاحب اثر یا کارگردان: تصویر شما میتواند شبیه به اثر هر شخصیت و مکتبی باشد؛ مثلاً یک کارگردان، نقاش، عکاس، استودیو، کمپانی و غیره.
- ترکیببندی: چیدمان تصویر چیست؟ چه چیزهایی در تصویر وجود دارند که دارای نام مشخصی هستند؟ مانند چیدمان سفره هفتسین.
- زمان وقوع صحنه: حالوهوای تصویر شما مربوط به چه دورۀ زمانی است؟ دورۀ تاریخی مانند دهه یا صده، فصل، روز و شب، مناسبت مانند شب یلدا و غیره.
- مکان جغرافیایی: لوکیشن مدنظرتان کجا است؟ فضای باز یا بسته، کشور و منطقه، کاخ و کوخ، دشت و دمن، خشکی و صحرا و غیره.
- شرایط جوی: آبوهوای لوکیشن شما در چه وضعیتی است؟ برفی و بارانی، ابری و آفتابی، آرام و متلاطم و غیره.
- مود و اتمسفر: تصویر شما چه حسوحالی دارد؟ غمانگیز یا شاد، خشمآلود یا مهربان و غیره.
- جزئیات حسی و غیرتصویری: تصاویر میتوانند مفاهیم غیرتصویری را هم منتقل کنند. از حسهای شنیداری، چشایی، بویایی و لامسهای در تصاویر استفاده کنید و باقی کار را به AI بسپارید.
- صفت صحنه: سعی کنید با برخی توصیفها، صحنه را وصف کنید؛ مثلاً خیرهکننده، عجیب، نفسگیر، رشکآمیز و غیره.
- سبک هنری: سبکهای هنری تعداد بیشماری دارند. آنقدر جستوجو کنید تا سبک مورد علاقۀ خود را پیدا کنید؛ مثلاً رئالیسم، آوانگارد، پاپ آرت و غیره.
- ابزارهای نقاشی: تصویر شما میتواند با هر ابزاری خلق شده باشد؛ مثلاً آبرنگ، گواش، پاستل، آکریلیک، جوهر و ….
پرسشی که احتمالاً حالا با آن مواجه شدهاید این است که آیا برای تولید هر تصویر باید همۀ این جزئیات را رعایت کنیم؟ البته که نه! شما حالا یک جعبه ابزار تخصصی در اختیار دارید که با استفاده از آن و افزودن چاشنی خلاقیت میتوانید بهترین تصاویر را برای پروژههای شخصی و تجاری خود تولید کنید.
سخن پایانی
اگر این نوشته را فقط اسکرول نکرده باشید و به سبک قدیمترها که اینستاگرام هنوز ما را به کسب نتیجههای فوری عادت نداده بود، فرصتی واقعی برای مطالعۀ آن اختصاص داده باشید، به شما تبریک میگوییم؛ زیرا نهتنها تصویرسازی با هوش مصنوعی را تا سطح پیشرفته آموختید، بلکه میلیونها تومان و دهها ساعت در هزینههای یادگیری مالی و زمانیِ خود صرفهجویی کردهاید. منظورم البته میلیونها تومان با همین ارزشِ پولِ لحظۀ انتشار است؛ چراکه این روزها از همیشه به قله نزدیکتر هستیم و ممکن است تا شما این مقاله را میخوانید، میلیاردها تومان صرفهجویی کنید! حالا میتوانید با گذاشتن کامنت، نویسنده را تشویق کنید تا مقالۀ بعدی را برای بستن این پرونده، آماده کند.
آیا تصویرسازی با هوش مصنوعی جایگزین هنرمندان میشود؟
این سؤال یکی از بحثبرانگیزترین سؤالات در این حوزه است. اگرچه هوش مصنوعی میتواند تصاویر بسیار زیبایی تولید کند؛ اما خلاقیت، احساسات و تفکر انتقادی که یک هنرمند به کار خود میآورد، هنوز جایگزین نشده است. در واقع، هوش مصنوعی میتواند بهعنوان یک ابزار قدرتمند برای هنرمندان عمل کند و به آنها امکان بدهد ایدههای خود را به واقعیت تبدیل کنند.
آیندۀ تصویرسازی با هوش مصنوعی چگونه خواهد بود؟
آینده تصویرسازی با هوش مصنوعی بسیار امیدوارکننده است. با پیشرفت تکنولوژی، میتوان انتظار داشت که این ابزارها قدرتمندتر و هوشمندتر شوند و کاربردهای متنوعتری پیدا کنند. همچنین، تعامل بین انسان و هوش مصنوعی در این حوزه به طور فزایندهای اهمیت پیدا خواهد کرد.