گوگل از هوش مصنوعی ویدیوساز Veo 3 رونمایی کرد؛ تولید ویدیوی صدادار از روی متن

خانه

علم و تکنولوژی

هوش مصنوعی

گوگل از هوش مصنوعی ویدیوساز Veo 3 رونمایی کرد؛ تولید ویدیوی صدادار از روی متن

افزودن به لیست علاقه‌مندی‌ها

زهرا دوستی نسب

31 اردیهشت 1404 | 14:11

زمان مطالعه: 2 دقیقه

در جریان رویداد I/O 2025، گوگل با معرفی دستاوردهای جدید خود در زمینه هوش مصنوعی، توجهات را به خود جلب کرد. در این میان، مدل Veo 3 به عنوان یک مدل پیشرفته در تولید ویدیو، بسیار مورد توجه قرار گرفت. Veo 3 قادر است از متن و تصویر ویدیو تولید کند و بر خلاف رقبایی مانند هوش مصنوعی Sora توانایی تولید همزمان صدا برای محتوای ویدیویی را نیز دارد که این ویژگی، آن را یک قدم جلوتر قرار می‌دهد.

Veo 3 با درک عمیق‌تر قوانین فیزیکی حاکم بر دنیای واقعی و هماهنگی دقیق حرکات لب، تجربه‌ای واقع‌گرایانه‌تر از محتوای تولید شده توسط هوش مصنوعی در اختیار کاربران قرار می‌دهد. این مدل قادر است، ویدیویی از پرواز پرندگان را به همراه صدای آواز آن‌ها تولید کند یا صحنه‌ای از خیابان شهر با صدای ترافیک تولید کند. نکته‌ی قابل توجه دیگر، امکان کنترل دوربین توسط کاربران است که به آن‌ها اجازه می‌دهد تا با استفاده از ارجاعات ویدیویی، صحنه‌های یکپارچه و منسجمی خلق کنند.

مشترکین طرح پولی Ultra گوگل در ایالات متحده می‌توانند از امروز با پرداخت هزینه‌ی ماهانه‌ی 249 دلار، از قابلیت‌های Veo 3 بهره‌مند شوند. این مدل همچنین از طریق پلتفرم سازمانی Vertex AI در اختیار کسب‌وکارها قرار خواهد گرفت. نکته‌ی جالب دیگر، ادغام Veo 3 در ابزار فیلم‌سازی جدید گوگل با نام Flow است. Flow با ترکیب قدرت Veo، جمینای و Imagen قادر است با دریافت توصیف صحنه‌ی سینمایی به زبان طبیعی، خروجی نهایی را به کاربر تحویل دهد. گوگل اعلام کرده است که برای بررسی پتانسیل‌های Veo، همکاری نزدیکی با فعالان صنعت سینما داشته است. در حال حاضر، Flow فقط برای مشترکان Google AI Pro و Ultra در ایالات متحده منتشر شده است، اما گوگل اعلام کرده است که به زودی در کشورهای بیشتری در دسترس قرار خواهد گرفت.

خوب است بدانید که گوگل پشتیبانی از Veo 2 را متوقف نکرده است. کاربران می‌توانند در Flow تصاویری از افراد، سبک‌ها یا اشیاء را به عنوان مرجع به این مدل بدهند تا نتایج بهتری دریافت کنند. ابزارهایی همچون کنترل دوربین، زوم روی اشیاء خاص، تغییر زاویه‌ی دید، تبدیل کادر پرتره به منظره و افزودن یا حذف عناصر تصویری نیز در این ابزار فراهم شده است؛ تا کاربران کنترل بیشتری روی خروجی نهایی داشته باشند.

علاوه بر Veo 3، گوگل از مدل تولید تصویر جدید خود یعنی Imagen 4 نیز رونمایی کرده است. این مدل در تولید جزئیات دقیق مانند بافت پارچه و موی حیوانات، عملکرد فوق‌العاده‌ای دارد. همچنین در خلق تصاویر فوتورئالیستی و هم در سبک‌های انتزاعی توانایی بسیار زیادی دارد.

Imagen 4 در نمایش تایپوگرافی نیز نسبت به نسخه‌های قبلی خود پیشرفت چشمگیری داشته و می‌تواند خروجی‌هایی با وضوح تا 2K در اندازه‌ها و نسبت‌های مختلف ارائه دهد. در حال حاضر، این مدل در اپلیکیشن Gemini، پلتفرم Vertex AI و ابزارهای Workspace در دسترس است. همچنین، قرار است به زودی نسخه‌ای از Imagen 3 با سرعتی 10 برابر بیشتر عرضه شود.

گوگل جهت مقابله با گسترش محتوای جعلی تولیدشده توسط هوش مصنوعی، پورتال جدیدی به نام SynthID Detector راه‌اندازی کرده است. کاربران می‌توانند فایل‌های تصویری یا ویدیویی مشکوک را در این پورتال بارگذاری کنند تا بررسی شود که آیا این فایل‌ها حاوی نشانه‌گذاری SynthID هستند یا خیر. این اقدام، گامی مهم در جهت افزایش شفافیت و مبارزه با سوءاستفاده از فناوری‌های هوش مصنوعی محسوب می‌شود.

فروشگاه اینترنتی داراکالا

جستجو در مجله داراکالا

رفع مسئولیت

در داراکالا بفروشید

کلیه حقوق این تارنما محفوظ و متعلق به فروشگاه اینترنتی دارا کالا می باشد