Myslíte si, že je čas uvolnit agenta AI, aby za vás udělal zakázky? Protože by to mohl být potenciálně nákladný experiment v reálném světě, Microsoft se pokouší zjistit, zda bude elektronický obchod mezi agenty skutečně fungovat, aniž by riskoval jeho použití v živém prostředí.
Začátkem tohoto týdne spustil tým jeho výzkumníků Magentic Marketplace, iniciativu, kterou popsali jako „open source simulační prostředí pro zkoumání četných možností agentních trhů a jejich společenských důsledků ve velkém měřítku“. Spravuje funkce, jako je udržování katalogů dostupného zboží a služeb, implementace vyhledávacích algoritmů, usnadnění komunikace mezi agenty a zpracování simulovaných plateb prostřednictvím centralizované transakční vrstvy.
Výzkumný tým o 23 lidech na blogu podrobně popisujícím projekt napsal, že poskytuje „základ pro studium těchto trhů a jejich vedení k výsledkům, z nichž mají prospěch všichni, na čemž záleží, protože většina výzkumů agentů AI se zaměřuje na izolované scénáře – jeden agent dokončující úkol nebo dva agenti vyjednávající jednoduchou transakci“.
Skutečné trhy však podle nich zahrnují velké množství agentů, kteří současně vyhledávají, komunikují a provádějí transakce, čímž vytvářejí složitou dynamiku, kterou nelze pochopit studiem agentů v izolaci, a zachycení této složitosti je nezbytné, „protože nasazení v reálném světě vyvolává kritické otázky týkající se blahobytu spotřebitelů, efektivity trhu, spravedlnosti, odolnosti vůči manipulaci a zaujatosti – otázky, na které nelze ve výrobním prostředí bezpečně odpovědět.“
Poznamenali, že i nejmodernější modely mohou vykazovat „pozoruhodná zranitelnost a předsudky v tržních prostředích“ a že v simulacích agenti „bojovali s příliš mnoha možnostmi, byli náchylní k manipulačním taktikám a vykazovali systémové předsudky, které vytvořily nespravedlivé výhody“.
Kromě toho dospěli k závěru, že simulační prostředí je zásadní pro pomoc organizacím porozumět souhře mezi tržními komponentami a agenty před jejich nasazením ve velkém.
Ve svém úplném technickém dokumentu výzkumníci také podrobně popsali významné odchylky chování mezi modely agentů, které, jak řekli, zahrnovaly „rozdílné schopnosti zpracovávat výsledky hlučného vyhledávání a různou náchylnost k manipulačním taktikám, přičemž mezery ve výkonu se rozšiřují s rostoucí složitostí trhu,“ a dodali, „tato zjištění podtrhují důležitost systematického hodnocení v ekonomickém prostředí s více agenty. Proprietární a open source modely fungují odlišně.“
Problémem je zaujatost a dezinformace
Lian Jye Su, hlavní analytik společnosti Omdia, popsal Magentic Marketplace jako „velmi zajímavý výzkum“, řekl, že i přes nedávný pokrok mají nadační modely stále mnoho slabin, včetně zkreslení a dezinformací.
Řekl tedy, že „každý provozovatel elektronického obchodu, který se chce spoléhat na agenty AI pro úkoly, jako je zadávání zakázek a doporučení, musí zajistit, aby výstupy tyto slabiny neobsahovaly. V současnosti existuje několik přístupů k dosažení tohoto cíle. Zábradlí a filtry umožní agentům AI generovat výstupy, které jsou cílené a vyvážené v souladu s pravidly a požadavky.“
Mnoho podniků, řekl Su, „také aplikuje kontextové inženýrství na pozemní agenty AI vytvořením dynamického systému, který poskytuje správný kontext, jako jsou relevantní data, nástroje a paměť. S těmito nástroji lze agenta AI vycvičit, aby se choval podobně jako lidský zaměstnanec a sladil zájmy organizace.“
Podobně řekl: „Proto můžeme obecně aplikovat stejnou filozofii na přijímání agentů AI v podnikovém sektoru. Agentům AI by nikdy nemělo být dovoleno chovat se plně autonomně bez dostatečné kontroly a rovnováhy a v kritických případech by se nemělo jednat o člověka ve smyčce.“
Thomas Randall, vedoucí výzkumu v Info-Tech Research Group, poznamenal: „Klíčovým zjištěním bylo, že když mají agenti jasné, strukturované informace (jako jsou přesná produktová data nebo transparentní výpisy), dělají mnohem lepší rozhodnutí.“ Zjištění však podle něj také odhalila, že s těmito agenty lze snadno manipulovat (například zavádějícími popisy produktů nebo skrytými výzvami) a že příliš mnoho možností agentů může ve skutečnosti zhoršit jejich výkon.
To znamená, řekl, „kvalita informací a design tržiště silně ovlivňují, jak dobře se tyto automatizované systémy chovají. Nakonec není jasné, jakou obrovskou přidanou hodnotu mohou organizace získat, pokud nechají autonomní agenty převzít nákup a prodej.“
Zástupný nákup „široký proces“
Jason Anderson, viceprezident a hlavní analytik společnosti Moor Insights & Strategy, uvedl, že oblasti, které výzkumníci zkoumali, „jsou dobře vymezeny, protože existuje mnoho různých způsobů, jak nakupovat a prodávat věci. Ale místo pokusu o provedení obchodních scénářů se tým snažil hlouběji porozumět a otestovat chování agentů oproti tomu, co mají lidé tendenci předpokládat přirozeně.“
Například řekl: „[humans] máme tendenci rychle zúžit naše výběrová kritéria na dvě nebo tři možnosti, protože pro lidi je těžké porovnávat širokou matici požadavků napříč mnoha potenciálními řešeními a ukazuje se, že výkon modelu také klesá, když existuje více možností. Takže v tomto ohledu existuje určitá podobnost mezi lidmi a agenty.“
Anderson také řekl: „Testováním zaujatosti a manipulace můžeme vidět další vzorce, například jak mají některé modely sklon k výběru první možnosti, která vyhovuje potřebám uživatele, místo aby zkoumaly všechny možnosti a vybíraly tu nejlepší. Tyto typy pozorování vždy pomohou modelům a agentům se časem zlepšovat.“
Pochválil také skutečnost, že společnost Microsoft otevřeně získává data a simulační prostředí. „Existuje tolik rozdílů ve způsobu, jakým jsou produkty a řešení vybírány, vyjednávány a nakupovány od B2B versus B2C, prémiových versus komoditních, kulturních rozdílů a podobně,“ řekl. „Otevřené zdroje tohoto nástroje budou cenné z hlediska toho, jak lze chování testovat a sdílet, což vše povede k budoucnosti, kde budeme moci AI důvěřovat transakcím.“
Jedna věc, kterou tento blog objasnil, poznamenal, „je, že na nákup agentů by se mělo pohlížet jako na široký proces a ne pouze na provedení transakce; existuje zjišťování, výběr, porovnávání, vyjednávání atd., a už jsme svědky toho, jak jsou v tomto procesu využívána umělá inteligence a agenti.
Nicméně poznamenal: „Myslím, že jsme zaznamenali větší úsilí ze strany agentů na prodejní straně procesu. Například Amazon může pomoci někomu objevit produkty pomocí své AI. Salesforce diskutoval o tom, jak jeho Agentforce Sales nyní umožňuje agentům pomáhat zákazníkům dozvědět se více o nabídce. Pokud [they] klikněte na propagaci a začněte klást otázky, agent jim může pomoci v procesu rozhodování.“
Opatrnost vyzývána
Na straně nákupu řekl: „Ještě nejsme ve fázi agentů, ale jsem si velmi jistý, že umělá inteligence a chatboti již hrají roli v obchodu. Jsem si například jistý, že nákupní týmy již používají nástroje chatu, aby pomohly odhalit prodejce před vydáním RFI nebo RFP. A pravděpodobně použití stejného nástroje k sepsání RFP je velmi podobný případ ze strany spotřebitele jako u srovnávacího agenta je použití prohlížeče RFP. jako Kometa.“
Anderson řekl, že by také „vyzval do určité míry opatrnosti u velkých dodavatelských organizací, aby zatím předělaly. Dosavadní poznatky naznačují, že se ještě musíme hodně učit, než uvidíme snížení počtu lidí ve smyčce, a pokud by se měli používat agenti, museli by být velmi úzce vymezeni a měla by být vyjednána dobrá sada pravidel mezi kupujícím a prodejcem, protože kontrola ‚můj agent se rozmazloval‘ pro vrácení objednávky není na seznamu).
Randall dodal, že pro provozovatele elektronického obchodu, kteří se do toho opřou, je „nezbytné prezentovat data v konzistentních, strojově čitelných formátech a být transparentní ohledně cen, dopravy a vracení. Znamená to také chránit systémy před škodlivými vstupy, jako je text, který by mohl oklamat kupujícího AI, aby udělal špatná rozhodnutí – závazky v této oblasti nejsou dobře definovány, což vede k právním bolestem hlavy a složitosti, pokud organizace zpochybňují, co jejich agenti koupili.“
Firmy by podle něj měly očekávat budoucnost, kdy někteří zákazníci budou roboti, a podle toho plánovat zásady a ochranu, včetně ověřování pro legitimní agenty a pravidel pro omezení zneužití.
Kromě toho, řekl Randall, „mnoho společností nemá zavedeno řízení, aby se pohnulo vpřed s agentní AI. Umožnění AI jednat autonomně přináší nové výzvy v oblasti řízení: jak zajistit odpovědnost, dodržování předpisů a bezpečnost, když rozhodnutí dělají spíše stroje než lidé – zvláště pokud tato rozhodnutí nelze efektivně sledovat.“
Sdílení pískoviště
Pro ty, kteří by chtěli prozkoumat dále, Microsoft zpřístupnil Magentic Marketplace jako open source prostředí pro zkoumání dynamiky agentského trhu s kódem, datovými sadami a šablonami experimentů dostupnými na GitHubu a Azure AI Foundry Labs.
Zdroj: techadvisor.com