آموزش ساخت ویدیو با هوش مصنوعی گوگل (Gemini)

آموزش ساخت ویدیو با هوش مصنوعی گوگل

آموزش ساخت ویدیو با هوش مصنوعی گوگل (Gemini) امروزه به لطف معرفی مدل‌های تخصصی تولید ویدیو توسط گوگل، به امری کاملاً ممکن تبدیل شده است. برخلاف تصور اولیه، این وظیفه مستقیماً توسط خود مدل زبان بزرگ Gemini انجام نمی‌شود، بلکه توسط مدل‌های پیشرفته‌ای که در درون پلتفرم Gemini ادغام شده‌اند، صورت می‌گیرد. برجسته‌ترین ابزار گوگل در این زمینه، مدل Veo است.

در این مقاله به صورت گام به گام آموزش ساخت ویدیو با هوش مصنوعی گوگل (Veo/Gemini)، پیش‌نیازها و نکات حرفه‌ای برای تولید خروجی باکیفیت ارائه شده است.

۱. معرفی ابزار کلیدی: Veo (مدل هوش مصنوعی گوگل برای ویدیو)

 

برای ساخت ویدیو با هوش مصنوعی گوگل، مدل اصلی مورد استفاده Veo (تلفظ: وی-او) است که جدیدترین و قدرتمندترین مدل هوش مصنوعی گوگل در زمینه تولید ویدیو (Text-to-Video) است.

Veo که به تدریج در داخل محیط Gemini یا از طریق ابزارهای مرتبط مانند Google Workspace Vids در دسترس قرار می‌گیرد، قابلیت‌های زیر را ارائه می‌دهد:

  • تبدیل متن به ویدیو: با ارائه یک توضیح متنی (پرامپت)، یک کلیپ ویدیویی تولید می‌کند.
  • تبدیل تصویر به ویدیو: با آپلود یک عکس و ارائه دستورات حرکتی، به تصویر جان می‌بخشد و آن را متحرک می‌کند.
  • تولید صدا (در نسخه‌های جدیدتر مانند Veo 3.1): علاوه بر تصویر، صدا، افکت‌های صوتی و حتی دیالوگ‌های هماهنگ با صحنه را تولید می‌کند.
  • کیفیت بالا: توانایی تولید ویدیو تا وضوح $720p$ و در برخی مدل‌ها $1080p$، با طول معمول ۸ تا ۱۶ ثانیه.

 

۲. پیش‌نیازهای استفاده از Veo در Gemini

Veo در حال حاضر (تاریخ نگارش این مقاله) یک قابلیت پیشرفته محسوب می‌شود و برای دسترسی به آن به یکی از موارد زیر نیاز دارید:

  1. اشتراک Google AI Pro: (معمولاً با هزینه ماهانه) این اشتراک به شما دسترسی به مدل سریع‌تر Veo Fast یا دسترسی محدود به مدل‌های پیشرفته‌تر را می‌دهد.
  2. اشتراک Google AI Ultra (یا Gemini Advanced): این اشتراک بالاترین سطح دسترسی به مدل‌های Veo (مانند Veo 3.1) و قابلیت‌های پیشرفته‌تر مانند Flow (برای حفظ ثبات کاراکتر) را فراهم می‌کند.
  3. دسترسی آزمایشی (در صورت فعال بودن): گوگل ممکن است این قابلیت را به صورت آزمایشی در کشورهای خاص برای کاربران منتخب فعال کند.

 

۳. آموزش گام به گام ساخت ویدیو با Gemini (Veo)

پس از اطمینان از داشتن دسترسی‌های لازم، می‌توانید طبق مراحل زیر برای ساخت اولین ویدیوی خود اقدام کنید:

گام ۱: ورود به پلتفرم Gemini

  1. به وب سایت Gemini (gemini.google.com) بروید.
  2. با حساب کاربری گوگل خود وارد شوید.

 

گام ۲: انتخاب ابزار تولید ویدیو

  1. در کادر ورودی متن (جایی که پرامپت خود را می‌نویسید)، به دنبال آیکون‌ها بگردید.
  2. روی آیکون “ویدیو” (Video) کلیک کنید. (این آیکون نشان دهنده فعال بودن مدل Veo است.) در برخی نسخه‌ها و مناطق، ممکن است ابتدا روی علامت $+$ کلیک کنید تا منوی ابزارها باز شود و سپس گزینه “ویدیو” را انتخاب کنید.

 

گام ۳: نوشتن پرامپت (دستور متنی)

این مهم‌ترین مرحله در آموزش ساخت ویدیو با هوش مصنوعی گوگل است. دستور شما (پرامپت) باید تا حد ممکن واضح و دقیق باشد تا هوش مصنوعی بتواند صحنه ذهنی شما را به واقعیت تبدیل کند.

عنصر پرامپتمثال
سوژه و عملیک سگ پا کوتاه (Corgy) که با خوشحالی در ساحل به دنبال توپ می‌دود.
جزئیات محیط و صحنهدر غروب آفتاب، با موج‌های آرام و نخل‌های بلند در پس‌زمینه.
سبک بصریسبک سینمایی (Cinematic)، با جزئیات واقعی (Realistic)، فیلمبرداری شده با دوربین آری الکسا (Alexa).
حرکت دوربینفیلمبرداری با حرکت آهسته (Slow Motion)، یا دوربین به آرامی به سمت سگ زوم می‌کند (Camera slowly zooms into the dog).

مثال پرامپت کامل:

«A photorealistic, cinematic shot of a majestic grey wolf howling at a full moon in a snowy forest. The camera is slowly panning up towards the sky. Soft blue and silver lighting. 4K resolution.»

(یک شات سینمایی و واقع‌گرایانه از یک گرگ خاکستری باشکوه که در حال زوزه کشیدن به ماه کامل در یک جنگل برفی است. دوربین به آرامی به سمت آسمان حرکت می‌کند. نورپردازی آبی و نقره‌ای ملایم. رزولوشن 4K.)

 

گام ۴: تولید و مشاهده نتیجه

  1. پس از وارد کردن پرامپت، دکمه ارسال (Send) را بزنید.
  2. Veo شروع به پردازش می‌کند. این فرآیند بسته به ترافیک سرور و پیچیدگی پرامپت شما، ممکن است چند دقیقه طول بکشد.
  3. ویدیو یا ویدیوهای تولید شده (معمولاً با فرمت MP4) در پنجره چت ظاهر می‌شوند و می‌توانید آن‌ها را پخش کنید.

 

گام ۵: دانلود و اشتراک‌گذاری

  1. برای دانلود ویدیو، روی آیکون دانلود کلیک کنید.
  2. توجه داشته باشید که تمام ویدیوهای تولید شده توسط گوگل، دارای یک واترمارک دیجیتال نامرئی (SynthID) هستند که نشان می‌دهد محتوا توسط هوش مصنوعی ساخته شده است.

 

۴. نکات حرفه‌ای برای بهبود کیفیت ویدیو

برای تولید ویدیوهای باکیفیت و حرفه‌ای با Veo، این تکنیک‌های پرامپت‌نویسی را به کار ببرید:

نکتهتوضیحمثال پرامپت
مشخص کردن حرکت سوژهتعیین کنید سوژه چگونه حرکت کند تا ویدیو ثابت نباشد.The robot is walking slowly towards the camera. (ربات به آرامی به سمت دوربین قدم می‌زند.)
کنترل دوربینحرکت دوربین (زوم، پن، تیلت) را تعریف کنید.A close-up shot, camera orbits around the subject. (یک نمای نزدیک، دوربین دور سوژه می‌چرخد.)
تعیین سبک هنریمشخص کنید ویدیو به چه سبکی تولید شود (واقعی، کارتونی، انیمیشن ۳بعدی و…).A cat sitting on a roof, stylized as a Pixar animation / Photorealistic (به سبک انیمیشن پیکسار / واقع‌گرایانه).
استفاده از صدا (Veo 3.1)اگر مدل شما Veo 3.1 را پشتیبانی می‌کند، صدا را در پرامپت بنویسید.A rainy day in Paris, with the sound of jazz music and falling rain. (یک روز بارانی در پاریس، همراه با صدای موسیقی جاز و باران.)
اضافه کردن جزئیات نورنورپردازی تأثیر زیادی در جذابیت بصری دارد.Golden hour lighting, neon street lights, soft natural light (نور ساعت طلایی، نور نئونی خیابان).

 

۵. قابلیت‌های دیگر گوگل برای ساخت ویدیو (Google Vids)

گوگل ابزار دیگری به نام Google Vids را در فضای Google Workspace (جایی که Google Docs و Sheets قرار دارند) معرفی کرده است که از Gemini برای ساخت ویدیوهای ارائه‌ای و تجاری استفاده می‌کند. این ابزار با رویکردی متفاوت، به کاربران اجازه می‌دهد:

  • یک سناریو متنی وارد کنند (پرامپت).
  • Gemini یک طرح کلی، اسلایدها، متن‌ها و حتی یک صداگذاری خودکار برای ویدیوهای توضیحی یا ارائه تولید می‌کند.
  • این ابزار بیشتر برای ساخت ویدیوهای آموزشی، بازاریابی یا مدیریت پروژه مناسب است و بر تولید محتوای کاملاً CGI/سینمایی متمرکز نیست.

 

جمع بندی

ساخت ویدیو با هوش مصنوعی گوگل یک قابلیت نوظهور و قدرتمند است که توسط مدل Veo و در داخل پلتفرم Gemini ارائه می‌شود. برای شروع، نیاز به دسترسی (معمولاً از طریق اشتراک‌های پولی) و تسلط بر پرامپت‌نویسی دقیق و تشریحی دارید تا بتوانید بهترین خروجی بصری را از این غول هوش مصنوعی دریافت کنید.

 

سؤالات متداول (FAQ)

  • ابزار اصلی چیست؟ مدل Veo، که به عنوان قابلیت در پلتفرم Gemini ادغام شده است.
  • آیا رایگان است؟ خیر، در حال حاضر معمولاً نیاز به اشتراک پولی Gemini Pro/Advanced دارد.
  • طول و کیفیت ویدیوها؟ کلیپ‌های کوتاه ۸ تا ۱۶ ثانیه‌ای با کیفیت $720p$ یا $1080p$.
  • آیا صدا دارد؟ بله، مدل‌های جدید Veo (مانند Veo 3.1) قابلیت تولید صدای بومی (افکت‌ها و دیالوگ‌ها) را دارند.
  • تبدیل عکس به ویدیو؟ بله، می‌توانید عکس آپلود کرده و با دستورات حرکتی به آن جان ببخشید.
  • واترمارک؟ ویدیوها دارای واترمارک دیجیتال نامرئی (SynthID) هستند که نشان‌دهنده ساخت توسط هوش مصنوعی است.

پست های مرتبط

مطالعه این پست ها رو از دست ندین!
آموزش ساخت عکس صنعتی از محصول با هوش مصنوعی

آموزش ساخت عکس صنعتی از محصول با هوش مصنوعی

آنچه در این پست میخوانید آموزش ساخت عکس صنعتی از محصول با هوش مصنوعیدرک مبانی هوش مصنوعی در تصویرسازی محصولانتخاب…

بیشتر بخوانید
آموزش ساخت پس زمینه گرافیکی با هوش مصنوعی

آموزش ساخت پس زمینه گرافیکی با هوش مصنوعی

آنچه در این پست میخوانید آموزش ساخت پس زمینه گرافیکی با هوش مصنوعیاصول کار با هوش مصنوعی مولد برای پس…

بیشتر بخوانید
آموزش ترجمه کردن با هوش مصنوعی Chatgpt

آموزش ترجمه کردن با هوش مصنوعی Chatgpt

آنچه در این پست میخوانید آموزش ترجمه کردن با هوش مصنوعی Chatgptنحوه شروع ترجمه و تنظیمات اولیهپرامپت نویسی مؤثر: کلید…

بیشتر بخوانید

نظرات

سوالات و نظراتتون رو با ما به اشتراک بذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *