Microsoft araşdırması: Süni intellekt agentləri ilk linkə klikləyir və satıcıların manipulyasiyalarına aldanır

MicrosoftArizona Universiteti alimləri süni intellekt agentlərinin onlayn ticarətdə necə davrandığını öyrənmək üçün Magentic Marketplace adlı xüsusi simulyator hazırlayıb.

Araşdırma göstərib ki, bir çox Sİ modelləri məhsul axtarışında ilk linkə üstünlük verir, satıcıların manipulyativ mesajlarına aldanırçoxsaylı seçimlər arasında düzgün qərar verməkdə çətinlik çəkir.


Tədqiqat: 100 Sİ agent, 300 “şirkət” və onlarla model

Simulyasiyada 100 süni intellekt agenti 300 “satıcı”nın təklifləri arasından seçim edib.
Sınaqlarda GPT-4o, GPT-5, Gemini 2.5 Flash, Claude Sonnet 4.5, Qwen 3OpenAI-nin gpt-oss-20b modelləri test olunub.
Agentlərdən məhsul axtarışı, yemək sifarişi və xidmət təminatçılarının seçimi kimi tapşırıqları yerinə yetirmələri istənilib.

Tədqiqatçılar “məhsul səbətinin faydalılıq göstəricisini” istifadəçilərin qiymətləndirmələri əsasında hesablayıblar.
Nəticədə məlum olub ki, seçimlərin sayı artdıqca, qərar keyfiyyəti azalır.
Məsələn, 100 məhsul arasından seçim zamanı GPT-5-in göstəricisi 2000-dən 1400-ə, Claude Sonnet-in 1800-dən 600-ə, Gemini 2.5-in isə 1700-dən 1350-ə düşüb.


İlk link sindromu: agentlər axtarış nəticələrini analiz etmir

Tədqiqatçılar bildiriblər ki, bir çox modellər axtarış nəticələrinin birinci linkini avtomatik seçir.
Məsələn:

  • GPT-4oQwen 3 — 100% hallarda birinci linki seçib,
  • Claude Sonnet 4.5 — 93%,
  • Gemini 2.5 — 86%.

Xidmət seçimi zamanı əksər modellər cəmi 5–10 şirkətə müraciət edib, yalnız Gemini 2.5 bütün 100 təchizatçıya sorğu göndərib.


Manipulyasiyalar və “prompt inyeksiyaları”

Sİ agentləri “50 min məmnun müştəri bizə qoşulub” və ya “№1 restoran” kimi manipulyativ ifadələrə qarşı da zəiflik göstəriblər.
Bəzi modellər, o cümlədən GPT-4oQwen 3, “prompt-inyeksiya” (yəni süni intellektə məhsulu alma əmri verən gizli mətn) olan məhsulları 100% hallarda seçib.
Yalnız Claude Sonnet 4 bütün manipulyativ strategiyalara qarşı tam davamlılıq göstərib, Gemini 2.5 Flash isə yalnız “prompt-inyeksiya” hallarına həssas olub.


Axtarış və naviqasiya çətinlikləri

Agentlər həmçinin axtarış sorğularını düzgün formalaşdırmaqda, səhifələr üzrə naviqasiyadauyğun təchizatçıların seçilməsində çətinlik çəkiblər.
Bu isə göstərir ki, süni intellekt agentləri hələ mürəkkəb alış davranışını etibarlı şəkildə təqlid edə bilmir.


Microsoft: “Açıq platforma ilə bazar davranışı öyrəniləcək”

Microsoft bildirib ki, “agent bazarı” sürətlə genişlənir və artıq bu sahədə OpenAI Operator, Anthropic Computer Use, Shopify SidekickSalesforce Einstein kimi məhsullar fəaliyyət göstərir.
Tədqiqatın nəticələrini təkrar yoxlamaq istəyən şirkətlər üçün Magentic Marketplace-in açıq mənbə kodu GitHub-da paylaşılıb.


📰 Mənbə: Microsoft Research, Bloomberg

spot_imgspot_img

Oxşar xəbərlər

spot_img