ګوګل د 2026 کال د مای 19 نیټې ته د multimodal AI ماډلونو د Gemini Omni کورنۍ اعلان کړه [1]، چې په دې سلسله کې یې Gemini Omni Flash نومېدل شوی لومړنی ماډل وړاندې کړ [2].

دا پيل ګوګل ته یو ستراتیژیک ګام دی ترڅو د generative AI په سیالۍ کې د څو modality وړمنو پراخولو سره خپل رقابت وساتي. د 이용ګارانو لپاره د داسې موادو menciptنې په فعالولو چې د input ډول یې هر څه وي، कंपनी غواړي د متن، AudioClip او بصري رسنیو ترمنځ تقلیدي خنډونه له منځه یوسي.

دا نوې سیستم چې په کالیفورنیا کې د Mountain View په Google I/O د پراستونکو کنفرانس کې معرفي شوی، د لوړ versatility لپاره ډیزاین شوی [3]. د ګوګل یو spokesperson وویل: "Gemini Omni کولی شي د هر ډول input سره هر څه تولید کړي" [4]. دا multimodal کړنی AI ته اجازه ورکوي چې د یوې مطلوبې پایلې (output) ترلاسه کولو لپاره په یو وخت کې د معلوماتو مختلف ډولونه پروسس کړي.

پیلنۍ ډیمونستریشنونو په ډیره توګه د ماډل د ویډیو تولیدولو وړمنو ته تمرکز کړی. د ګوګل یو product lead وویل: "Omni Flash کولی شي له متن، عکسونو یا AudioClip څخه د ژوند په څیر ویډیوګانې تولید کړي" [5]. که څه هم ځینې راپورونه وړاندې کوي چې دا ماډل لا دمخه کولی شي په مختلفو modalities کې هر څه mencipt کړي [6]، خو نور راپورونه ښيي چې لومړنی Omni ماډل اوس مهال په ځانګړي ډول یوازې د ویډیو تولید ملاتړ کوي [7].

د Gemini AI ټیم د دې ریلیز د تر ниټې پورې ترټولو وړمن multimodal ماډل په توګه تعریف کړی [8]. د Omni کورنۍ هدف دا دی چې 이용ګارانو ته اجازه ورکړي چې د هر ډول پیلونکي input څخه په اسانۍ سره د ویډیو، عکسونو، متن او AudioClip menciptنې ترمنځ لیږد وکړي [9]. دا انعطاف د پراستونکو او creators لپاره د generative AI ګټې زیاتولو لپاره intended دی.

د ګوګل دا هڅه چې "any-to-any" تولید ته لاړ شي، Gemini Omni Flash د نورو لوړ پویا multimodal سیستمونو سره په مستقیم رقابت کې ځای پر ځای کوي. شرکت غواړي چې دا ماډل د رسنیو تولید لپاره د یو جامع وسیلې په توګه کار وکړي او د ډیجیټل موادو د مختلفو ډولونو ترمنځ خنډونه له منځه یوسي.

"Gemini Omni کولی شي د هر ډول input سره هر څه تولید کړي."

د Gemini Omni Flash معرفي د تخصصی AI ماډلونو څخه د یوې متحدې 'omni' architecture ته د لیږد نښه ده. د ټولو رسنیو ډولونو کې د input او output پروسې په معیاري کولو سره، ګوګل هڅه کوي چې د موادو menciptنې ستونزه کمه کړي، چې احتمالا د مختلفو جلا AI وسیلو یو واحد multimodal interface ته اړو کړي.