Microsoft Kosmos-2: Jak umělá inteligence mohla interagovat se světem

Kosmos-2 by mohl být revoluční pro Embodiment AI.

  • Nový výzkum financovaný společností Microsoft se ponoří do fyzičnosti umělé inteligence.
  • Jazykový model Kosmos-2 byl vycvičen k vnímání prostorových konceptů.
  • Přichází také s vlastní znalostí vesmíru.
microsoft kosmos 2

Microsoft v poslední době investuje hodně peněz do financování výzkumu AI. Orca 13B je open source pro veřejnost poté, co jej vytvořil tým výzkumníků sestaven a financovaný společností Microsoft.

LongMem je naděje Microsoftu na neomezenou délku kontextu v modelech AI. A je to také produkt výzkumu financovaného technologickým gigantem se sídlem v Redmondu.

Phi-1, nový jazykový model pro kódování, je schopen samostatně se učit a rozvíjet znalosti. Microsoft financoval výzkum.

A zdá se, že Embodiment AI je dalším úkolem ve vývoji AI. Ale Microsoft by mohl mít odpověď s dalším výzkumem AI. Tentokrát jde o Kosmos-2, nový model umělé inteligence, který pokládá základy pro Embodiment AI.

Kosmos-2 od Microsoftu je prototypem Embodiment AI

Možná je to poprvé, co slyšíte o Embodiment AI. No, název je sám o sobě dost sugestivní. Takže co je Embodiment AI, můžete se zeptat?

Embodiment AI je obor umělé inteligence, který se zaměřuje na vývoj inteligentních agentů, kteří mají fyzické tělo a mohou smysluplně interagovat se světem.

Koncept je založen na myšlence, že fyzické tělo hraje významnou roli v tom, jak se agent učí a činí rozhodnutí.microsoft kosmos 2

Jinými slovy, pokud by umělá inteligence měla tělo a pohybovala by se, mohla by se z toho poučit a reagovat a tvořit odpovědi a také podle toho interagovat. A pokud si myslíte, že vstupujeme na území sci-fi, držte se. Umělá inteligence se vždy měla stát fyzickou.

Podle výzkumu je Kosmos-2 jazykový model, který umožňuje nové možnosti vnímání popisů objektů (např. ohraničujících rámečků) a uzemnění textu vizuálnímu světu. Zastoupení výzkumníci odkazují na výrazy v Markdown jako na odkazy, tedy „rozpětí textu“, kde popisy objektů jsou sekvence tokenů umístění.

Společně s multimodálními korpusy zkonstruovali rozsáhlá data z uzemněných párů obrázek-text (nazývaných GrIT) pro trénování modelu. Kromě integrace stávajících schopností MLLM v Kosmos-2 model také integruje schopnost uzemnění do aplikací.

To znamená, že jazyk učinil kroky kupředu k vnímání prostoru a přichází s vlastním vnímáním, jednáním a modelováním světa. Vědci si myslí, že Kosmos-2 je základem pro fyzickou AI. Můžete si přečíst výzkum tady.

Co si myslíte o Microsoft Kosmos 2? Bylo by dobré, kdyby AI měla fyzickou podobu nebo ne? Dejte nám vědět v sekci komentářů níže.

Na Xboxu budete moci nahlásit nevhodné hlasové chaty

Na Xboxu budete moci nahlásit nevhodné hlasové chatyMicrosoftXbox

Tato funkce je k dispozici v programu Xbox Insider.Tato funkce je dostupná na Xbox X/S a Xbox One.Anglicky mluvící země to dostávají jako první.Prozatím je k dispozici pouze angličtina, ale budou p...

Přečtěte si více
Co si myslíte o novém písmu Aptos od Microsoftu?

Co si myslíte o novém písmu Aptos od Microsoftu?MicrosoftMicrosoft Office

Aptos nahradí Calibri v následujících měsících.Po 15 letech Calibri končí.Na jeho místo nastoupí Aptos, nový výchozí font Microsoftu.Nové písmo by mělo být dostupné jako výchozí písmo v následující...

Přečtěte si více
IntelliFrame změní způsob, jakým vidíte lidi v Teams

IntelliFrame změní způsob, jakým vidíte lidi v TeamsMicrosoftTýmy Společnosti Microsoft

Funkce IntelliFrame přichází do Teams v srpnu.Bude fungovat v srpnu až září.Budete potřebovat Windows s licencí Pro.K dispozici je seznam podporovaných webových kamer, které si můžete prohlédnout.P...

Přečtěte si více