در جریان رویداد I/O 2025، گوگل با معرفی دستاوردهای جدید خود در زمینه هوش مصنوعی، توجهات را به خود جلب کرد. در این میان، مدل Veo 3 به عنوان یک مدل پیشرفته در تولید ویدیو، بسیار مورد توجه قرار گرفت. Veo 3 قادر است از متن و تصویر ویدیو تولید کند و بر خلاف رقبایی مانند هوش مصنوعی Sora توانایی تولید همزمان صدا برای محتوای ویدیویی را نیز دارد که این ویژگی، آن را یک قدم جلوتر قرار میدهد.
Veo 3 با درک عمیقتر قوانین فیزیکی حاکم بر دنیای واقعی و هماهنگی دقیق حرکات لب، تجربهای واقعگرایانهتر از محتوای تولید شده توسط هوش مصنوعی در اختیار کاربران قرار میدهد. این مدل قادر است، ویدیویی از پرواز پرندگان را به همراه صدای آواز آنها تولید کند یا صحنهای از خیابان شهر با صدای ترافیک تولید کند. نکتهی قابل توجه دیگر، امکان کنترل دوربین توسط کاربران است که به آنها اجازه میدهد تا با استفاده از ارجاعات ویدیویی، صحنههای یکپارچه و منسجمی خلق کنند.
مشترکین طرح پولی Ultra گوگل در ایالات متحده میتوانند از امروز با پرداخت هزینهی ماهانهی 249 دلار، از قابلیتهای Veo 3 بهرهمند شوند. این مدل همچنین از طریق پلتفرم سازمانی Vertex AI در اختیار کسبوکارها قرار خواهد گرفت. نکتهی جالب دیگر، ادغام Veo 3 در ابزار فیلمسازی جدید گوگل با نام Flow است. Flow با ترکیب قدرت Veo، جمینای و Imagen قادر است با دریافت توصیف صحنهی سینمایی به زبان طبیعی، خروجی نهایی را به کاربر تحویل دهد. گوگل اعلام کرده است که برای بررسی پتانسیلهای Veo، همکاری نزدیکی با فعالان صنعت سینما داشته است. در حال حاضر، Flow فقط برای مشترکان Google AI Pro و Ultra در ایالات متحده منتشر شده است، اما گوگل اعلام کرده است که به زودی در کشورهای بیشتری در دسترس قرار خواهد گرفت.
خوب است بدانید که گوگل پشتیبانی از Veo 2 را متوقف نکرده است. کاربران میتوانند در Flow تصاویری از افراد، سبکها یا اشیاء را به عنوان مرجع به این مدل بدهند تا نتایج بهتری دریافت کنند. ابزارهایی همچون کنترل دوربین، زوم روی اشیاء خاص، تغییر زاویهی دید، تبدیل کادر پرتره به منظره و افزودن یا حذف عناصر تصویری نیز در این ابزار فراهم شده است؛ تا کاربران کنترل بیشتری روی خروجی نهایی داشته باشند.
علاوه بر Veo 3، گوگل از مدل تولید تصویر جدید خود یعنی Imagen 4 نیز رونمایی کرده است. این مدل در تولید جزئیات دقیق مانند بافت پارچه و موی حیوانات، عملکرد فوقالعادهای دارد. همچنین در خلق تصاویر فوتورئالیستی و هم در سبکهای انتزاعی توانایی بسیار زیادی دارد.
Imagen 4 در نمایش تایپوگرافی نیز نسبت به نسخههای قبلی خود پیشرفت چشمگیری داشته و میتواند خروجیهایی با وضوح تا 2K در اندازهها و نسبتهای مختلف ارائه دهد. در حال حاضر، این مدل در اپلیکیشن Gemini، پلتفرم Vertex AI و ابزارهای Workspace در دسترس است. همچنین، قرار است به زودی نسخهای از Imagen 3 با سرعتی 10 برابر بیشتر عرضه شود.
گوگل جهت مقابله با گسترش محتوای جعلی تولیدشده توسط هوش مصنوعی، پورتال جدیدی به نام SynthID Detector راهاندازی کرده است. کاربران میتوانند فایلهای تصویری یا ویدیویی مشکوک را در این پورتال بارگذاری کنند تا بررسی شود که آیا این فایلها حاوی نشانهگذاری SynthID هستند یا خیر. این اقدام، گامی مهم در جهت افزایش شفافیت و مبارزه با سوءاستفاده از فناوریهای هوش مصنوعی محسوب میشود.
کلیه حقوق این تارنما محفوظ و متعلق به فروشگاه اینترنتی دارا کالا می باشد