Microsoft və Arizona Universiteti alimləri süni intellekt agentlərinin onlayn ticarətdə necə davrandığını öyrənmək üçün Magentic Marketplace adlı xüsusi simulyator hazırlayıb.
Araşdırma göstərib ki, bir çox Sİ modelləri məhsul axtarışında ilk linkə üstünlük verir, satıcıların manipulyativ mesajlarına aldanır və çoxsaylı seçimlər arasında düzgün qərar verməkdə çətinlik çəkir.
Tədqiqat: 100 Sİ agent, 300 “şirkət” və onlarla model
Simulyasiyada 100 süni intellekt agenti 300 “satıcı”nın təklifləri arasından seçim edib.
Sınaqlarda GPT-4o, GPT-5, Gemini 2.5 Flash, Claude Sonnet 4.5, Qwen 3 və OpenAI-nin gpt-oss-20b modelləri test olunub.
Agentlərdən məhsul axtarışı, yemək sifarişi və xidmət təminatçılarının seçimi kimi tapşırıqları yerinə yetirmələri istənilib.
Tədqiqatçılar “məhsul səbətinin faydalılıq göstəricisini” istifadəçilərin qiymətləndirmələri əsasında hesablayıblar.
Nəticədə məlum olub ki, seçimlərin sayı artdıqca, qərar keyfiyyəti azalır.
Məsələn, 100 məhsul arasından seçim zamanı GPT-5-in göstəricisi 2000-dən 1400-ə, Claude Sonnet-in 1800-dən 600-ə, Gemini 2.5-in isə 1700-dən 1350-ə düşüb.
İlk link sindromu: agentlər axtarış nəticələrini analiz etmir
Tədqiqatçılar bildiriblər ki, bir çox modellər axtarış nəticələrinin birinci linkini avtomatik seçir.
Məsələn:
- GPT-4o və Qwen 3 — 100% hallarda birinci linki seçib,
- Claude Sonnet 4.5 — 93%,
- Gemini 2.5 — 86%.
Xidmət seçimi zamanı əksər modellər cəmi 5–10 şirkətə müraciət edib, yalnız Gemini 2.5 bütün 100 təchizatçıya sorğu göndərib.
Manipulyasiyalar və “prompt inyeksiyaları”
Sİ agentləri “50 min məmnun müştəri bizə qoşulub” və ya “№1 restoran” kimi manipulyativ ifadələrə qarşı da zəiflik göstəriblər.
Bəzi modellər, o cümlədən GPT-4o və Qwen 3, “prompt-inyeksiya” (yəni süni intellektə məhsulu alma əmri verən gizli mətn) olan məhsulları 100% hallarda seçib.
Yalnız Claude Sonnet 4 bütün manipulyativ strategiyalara qarşı tam davamlılıq göstərib, Gemini 2.5 Flash isə yalnız “prompt-inyeksiya” hallarına həssas olub.
Axtarış və naviqasiya çətinlikləri
Agentlər həmçinin axtarış sorğularını düzgün formalaşdırmaqda, səhifələr üzrə naviqasiyada və uyğun təchizatçıların seçilməsində çətinlik çəkiblər.
Bu isə göstərir ki, süni intellekt agentləri hələ mürəkkəb alış davranışını etibarlı şəkildə təqlid edə bilmir.
Microsoft: “Açıq platforma ilə bazar davranışı öyrəniləcək”
Microsoft bildirib ki, “agent bazarı” sürətlə genişlənir və artıq bu sahədə OpenAI Operator, Anthropic Computer Use, Shopify Sidekick və Salesforce Einstein kimi məhsullar fəaliyyət göstərir.
Tədqiqatın nəticələrini təkrar yoxlamaq istəyən şirkətlər üçün Magentic Marketplace-in açıq mənbə kodu GitHub-da paylaşılıb.
📰 Mənbə: Microsoft Research, Bloomberg



