آموزش ساخت ویدیو با هوش مصنوعی گوگل (Gemini)
آموزش ساخت ویدیو با هوش مصنوعی گوگل
آموزش ساخت ویدیو با هوش مصنوعی گوگل (Gemini) امروزه به لطف معرفی مدلهای تخصصی تولید ویدیو توسط گوگل، به امری کاملاً ممکن تبدیل شده است. برخلاف تصور اولیه، این وظیفه مستقیماً توسط خود مدل زبان بزرگ Gemini انجام نمیشود، بلکه توسط مدلهای پیشرفتهای که در درون پلتفرم Gemini ادغام شدهاند، صورت میگیرد. برجستهترین ابزار گوگل در این زمینه، مدل Veo است.
در این مقاله به صورت گام به گام آموزش ساخت ویدیو با هوش مصنوعی گوگل (Veo/Gemini)، پیشنیازها و نکات حرفهای برای تولید خروجی باکیفیت ارائه شده است.
۱. معرفی ابزار کلیدی: Veo (مدل هوش مصنوعی گوگل برای ویدیو)
برای ساخت ویدیو با هوش مصنوعی گوگل، مدل اصلی مورد استفاده Veo (تلفظ: وی-او) است که جدیدترین و قدرتمندترین مدل هوش مصنوعی گوگل در زمینه تولید ویدیو (Text-to-Video) است.
Veo که به تدریج در داخل محیط Gemini یا از طریق ابزارهای مرتبط مانند Google Workspace Vids در دسترس قرار میگیرد، قابلیتهای زیر را ارائه میدهد:
- تبدیل متن به ویدیو: با ارائه یک توضیح متنی (پرامپت)، یک کلیپ ویدیویی تولید میکند.
- تبدیل تصویر به ویدیو: با آپلود یک عکس و ارائه دستورات حرکتی، به تصویر جان میبخشد و آن را متحرک میکند.
- تولید صدا (در نسخههای جدیدتر مانند Veo 3.1): علاوه بر تصویر، صدا، افکتهای صوتی و حتی دیالوگهای هماهنگ با صحنه را تولید میکند.
- کیفیت بالا: توانایی تولید ویدیو تا وضوح $720p$ و در برخی مدلها $1080p$، با طول معمول ۸ تا ۱۶ ثانیه.
۲. پیشنیازهای استفاده از Veo در Gemini
Veo در حال حاضر (تاریخ نگارش این مقاله) یک قابلیت پیشرفته محسوب میشود و برای دسترسی به آن به یکی از موارد زیر نیاز دارید:
- اشتراک Google AI Pro: (معمولاً با هزینه ماهانه) این اشتراک به شما دسترسی به مدل سریعتر Veo Fast یا دسترسی محدود به مدلهای پیشرفتهتر را میدهد.
- اشتراک Google AI Ultra (یا Gemini Advanced): این اشتراک بالاترین سطح دسترسی به مدلهای Veo (مانند Veo 3.1) و قابلیتهای پیشرفتهتر مانند Flow (برای حفظ ثبات کاراکتر) را فراهم میکند.
- دسترسی آزمایشی (در صورت فعال بودن): گوگل ممکن است این قابلیت را به صورت آزمایشی در کشورهای خاص برای کاربران منتخب فعال کند.
۳. آموزش گام به گام ساخت ویدیو با Gemini (Veo)
پس از اطمینان از داشتن دسترسیهای لازم، میتوانید طبق مراحل زیر برای ساخت اولین ویدیوی خود اقدام کنید:
گام ۱: ورود به پلتفرم Gemini
- به وب سایت Gemini (gemini.google.com) بروید.
- با حساب کاربری گوگل خود وارد شوید.
گام ۲: انتخاب ابزار تولید ویدیو
- در کادر ورودی متن (جایی که پرامپت خود را مینویسید)، به دنبال آیکونها بگردید.
- روی آیکون “ویدیو” (Video) کلیک کنید. (این آیکون نشان دهنده فعال بودن مدل Veo است.) در برخی نسخهها و مناطق، ممکن است ابتدا روی علامت $+$ کلیک کنید تا منوی ابزارها باز شود و سپس گزینه “ویدیو” را انتخاب کنید.
گام ۳: نوشتن پرامپت (دستور متنی)
این مهمترین مرحله در آموزش ساخت ویدیو با هوش مصنوعی گوگل است. دستور شما (پرامپت) باید تا حد ممکن واضح و دقیق باشد تا هوش مصنوعی بتواند صحنه ذهنی شما را به واقعیت تبدیل کند.
| عنصر پرامپت | مثال |
| سوژه و عمل | یک سگ پا کوتاه (Corgy) که با خوشحالی در ساحل به دنبال توپ میدود. |
| جزئیات محیط و صحنه | در غروب آفتاب، با موجهای آرام و نخلهای بلند در پسزمینه. |
| سبک بصری | سبک سینمایی (Cinematic)، با جزئیات واقعی (Realistic)، فیلمبرداری شده با دوربین آری الکسا (Alexa). |
| حرکت دوربین | فیلمبرداری با حرکت آهسته (Slow Motion)، یا دوربین به آرامی به سمت سگ زوم میکند (Camera slowly zooms into the dog). |
مثال پرامپت کامل:
«A photorealistic, cinematic shot of a majestic grey wolf howling at a full moon in a snowy forest. The camera is slowly panning up towards the sky. Soft blue and silver lighting. 4K resolution.»
(یک شات سینمایی و واقعگرایانه از یک گرگ خاکستری باشکوه که در حال زوزه کشیدن به ماه کامل در یک جنگل برفی است. دوربین به آرامی به سمت آسمان حرکت میکند. نورپردازی آبی و نقرهای ملایم. رزولوشن 4K.)
گام ۴: تولید و مشاهده نتیجه
- پس از وارد کردن پرامپت، دکمه ارسال (Send) را بزنید.
- Veo شروع به پردازش میکند. این فرآیند بسته به ترافیک سرور و پیچیدگی پرامپت شما، ممکن است چند دقیقه طول بکشد.
- ویدیو یا ویدیوهای تولید شده (معمولاً با فرمت MP4) در پنجره چت ظاهر میشوند و میتوانید آنها را پخش کنید.
گام ۵: دانلود و اشتراکگذاری
- برای دانلود ویدیو، روی آیکون دانلود کلیک کنید.
- توجه داشته باشید که تمام ویدیوهای تولید شده توسط گوگل، دارای یک واترمارک دیجیتال نامرئی (SynthID) هستند که نشان میدهد محتوا توسط هوش مصنوعی ساخته شده است.
۴. نکات حرفهای برای بهبود کیفیت ویدیو
برای تولید ویدیوهای باکیفیت و حرفهای با Veo، این تکنیکهای پرامپتنویسی را به کار ببرید:
| نکته | توضیح | مثال پرامپت |
| مشخص کردن حرکت سوژه | تعیین کنید سوژه چگونه حرکت کند تا ویدیو ثابت نباشد. | The robot is walking slowly towards the camera. (ربات به آرامی به سمت دوربین قدم میزند.) |
| کنترل دوربین | حرکت دوربین (زوم، پن، تیلت) را تعریف کنید. | A close-up shot, camera orbits around the subject. (یک نمای نزدیک، دوربین دور سوژه میچرخد.) |
| تعیین سبک هنری | مشخص کنید ویدیو به چه سبکی تولید شود (واقعی، کارتونی، انیمیشن ۳بعدی و…). | A cat sitting on a roof, stylized as a Pixar animation / Photorealistic (به سبک انیمیشن پیکسار / واقعگرایانه). |
| استفاده از صدا (Veo 3.1) | اگر مدل شما Veo 3.1 را پشتیبانی میکند، صدا را در پرامپت بنویسید. | A rainy day in Paris, with the sound of jazz music and falling rain. (یک روز بارانی در پاریس، همراه با صدای موسیقی جاز و باران.) |
| اضافه کردن جزئیات نور | نورپردازی تأثیر زیادی در جذابیت بصری دارد. | Golden hour lighting, neon street lights, soft natural light (نور ساعت طلایی، نور نئونی خیابان). |
۵. قابلیتهای دیگر گوگل برای ساخت ویدیو (Google Vids)
گوگل ابزار دیگری به نام Google Vids را در فضای Google Workspace (جایی که Google Docs و Sheets قرار دارند) معرفی کرده است که از Gemini برای ساخت ویدیوهای ارائهای و تجاری استفاده میکند. این ابزار با رویکردی متفاوت، به کاربران اجازه میدهد:
- یک سناریو متنی وارد کنند (پرامپت).
- Gemini یک طرح کلی، اسلایدها، متنها و حتی یک صداگذاری خودکار برای ویدیوهای توضیحی یا ارائه تولید میکند.
- این ابزار بیشتر برای ساخت ویدیوهای آموزشی، بازاریابی یا مدیریت پروژه مناسب است و بر تولید محتوای کاملاً CGI/سینمایی متمرکز نیست.
جمع بندی
ساخت ویدیو با هوش مصنوعی گوگل یک قابلیت نوظهور و قدرتمند است که توسط مدل Veo و در داخل پلتفرم Gemini ارائه میشود. برای شروع، نیاز به دسترسی (معمولاً از طریق اشتراکهای پولی) و تسلط بر پرامپتنویسی دقیق و تشریحی دارید تا بتوانید بهترین خروجی بصری را از این غول هوش مصنوعی دریافت کنید.
سؤالات متداول (FAQ)
- ابزار اصلی چیست؟ مدل Veo، که به عنوان قابلیت در پلتفرم Gemini ادغام شده است.
- آیا رایگان است؟ خیر، در حال حاضر معمولاً نیاز به اشتراک پولی Gemini Pro/Advanced دارد.
- طول و کیفیت ویدیوها؟ کلیپهای کوتاه ۸ تا ۱۶ ثانیهای با کیفیت $720p$ یا $1080p$.
- آیا صدا دارد؟ بله، مدلهای جدید Veo (مانند Veo 3.1) قابلیت تولید صدای بومی (افکتها و دیالوگها) را دارند.
- تبدیل عکس به ویدیو؟ بله، میتوانید عکس آپلود کرده و با دستورات حرکتی به آن جان ببخشید.
- واترمارک؟ ویدیوها دارای واترمارک دیجیتال نامرئی (SynthID) هستند که نشاندهنده ساخت توسط هوش مصنوعی است.



