AI chatboti jsou horší než vyhledávače pro lékařskou pomoc

Podle nové studie z Oxford Internet Institute a Nuffield Department of Primary Care Health Sciences na Oxfordské univerzitě existuje jasná propast mezi teoretickými lékařskými znalostmi velkých jazykových modelů (LLM) a jejich praktickou užitečností pro pacienty. Výzkumu prováděného ve spolupráci s MLCommons a dalšími institucemi se zúčastnilo 1 298 lidí ve Spojeném království.

Ve studii byla jedna skupina požádána, aby používala LLM jako GPT-4o, Llama 3 a Command R k posouzení zdravotních příznaků a navrhování postupu, zatímco kontrolní skupina se spoléhala na své obvyklé metody, jako jsou vyhledávače nebo vlastní znalosti.

Výsledky ukázaly, že skupina využívající nástroje generativní umělé inteligence (genAI) si při hodnocení naléhavosti stavu nevedla lépe než kontrolní skupina. Podle The Register byli také horší v identifikaci správného zdravotního stavu.

Zdroj: techadvisor.com