Microsoft araşdırması: Süni intellekt agentləri ilk linkə klikləyir və satıcıların manipulyasiyalarına aldanır

MicrosoftArizona Universiteti alimləri süni intellekt agentlərinin onlayn ticarətdə necə davrandığını öyrənmək üçün Magentic Marketplace adlı xüsusi simulyator hazırlayıb.

Araşdırma göstərib ki, bir çox Sİ modelləri məhsul axtarışında ilk linkə üstünlük verir, satıcıların manipulyativ mesajlarına aldanırçoxsaylı seçimlər arasında düzgün qərar verməkdə çətinlik çəkir.


Tədqiqat: 100 Sİ agent, 300 “şirkət” və onlarla model

Simulyasiyada 100 süni intellekt agenti 300 “satıcı”nın təklifləri arasından seçim edib.
Sınaqlarda GPT-4o, GPT-5, Gemini 2.5 Flash, Claude Sonnet 4.5, Qwen 3OpenAI-nin gpt-oss-20b modelləri test olunub.
Agentlərdən məhsul axtarışı, yemək sifarişi və xidmət təminatçılarının seçimi kimi tapşırıqları yerinə yetirmələri istənilib.

Tədqiqatçılar “məhsul səbətinin faydalılıq göstəricisini” istifadəçilərin qiymətləndirmələri əsasında hesablayıblar.
Nəticədə məlum olub ki, seçimlərin sayı artdıqca, qərar keyfiyyəti azalır.
Məsələn, 100 məhsul arasından seçim zamanı GPT-5-in göstəricisi 2000-dən 1400-ə, Claude Sonnet-in 1800-dən 600-ə, Gemini 2.5-in isə 1700-dən 1350-ə düşüb.


İlk link sindromu: agentlər axtarış nəticələrini analiz etmir

Tədqiqatçılar bildiriblər ki, bir çox modellər axtarış nəticələrinin birinci linkini avtomatik seçir.
Məsələn:

  • GPT-4oQwen 3 — 100% hallarda birinci linki seçib,
  • Claude Sonnet 4.5 — 93%,
  • Gemini 2.5 — 86%.

Xidmət seçimi zamanı əksər modellər cəmi 5–10 şirkətə müraciət edib, yalnız Gemini 2.5 bütün 100 təchizatçıya sorğu göndərib.


Manipulyasiyalar və “prompt inyeksiyaları”

Sİ agentləri “50 min məmnun müştəri bizə qoşulub” və ya “№1 restoran” kimi manipulyativ ifadələrə qarşı da zəiflik göstəriblər.
Bəzi modellər, o cümlədən GPT-4oQwen 3, “prompt-inyeksiya” (yəni süni intellektə məhsulu alma əmri verən gizli mətn) olan məhsulları 100% hallarda seçib.
Yalnız Claude Sonnet 4 bütün manipulyativ strategiyalara qarşı tam davamlılıq göstərib, Gemini 2.5 Flash isə yalnız “prompt-inyeksiya” hallarına həssas olub.


Axtarış və naviqasiya çətinlikləri

Agentlər həmçinin axtarış sorğularını düzgün formalaşdırmaqda, səhifələr üzrə naviqasiyadauyğun təchizatçıların seçilməsində çətinlik çəkiblər.
Bu isə göstərir ki, süni intellekt agentləri hələ mürəkkəb alış davranışını etibarlı şəkildə təqlid edə bilmir.


Microsoft: “Açıq platforma ilə bazar davranışı öyrəniləcək”

Microsoft bildirib ki, “agent bazarı” sürətlə genişlənir və artıq bu sahədə OpenAI Operator, Anthropic Computer Use, Shopify SidekickSalesforce Einstein kimi məhsullar fəaliyyət göstərir.
Tədqiqatın nəticələrini təkrar yoxlamaq istəyən şirkətlər üçün Magentic Marketplace-in açıq mənbə kodu GitHub-da paylaşılıb.


📰 Mənbə: Microsoft Research, Bloomberg

spot_imgspot_img

Oxşar xəbərlər

Yunanıstan süni intellekti Konstitusiyasına daxil edir

Yunanıstan süni intellektin etik və hüquqi çərçivəsini konstitusiya səviyyəsində tənzimləmək istəyir.

Spot Bitcoin ETF-ləri 9 ay sonra ilk dəfə 6 həftə ardıcıl xalis daxilolma qeydə alıb

Spot Bitcoin ETF-lərində 6 həftəlik ardıcıl xalis daxilolma qeydə alınıb.

ABŞ tənzimləyicisi Avride robotaksi qəzaları ilə bağlı araşdırmaya başlayır

Keçmiş Yandex özünüidarə bölməsi olan Avride startapı ABŞ-da robotaksi qəzaları ilə bağlı NHTSA araşdırması üzləşib.

Fintex startapı Parker iflas ərizəsi verdi

Parker, korporativ kredit kartları üzrə ixtisaslaşmış fintex startapı, iflas ərizəsi təqdim etdi.

Rusiya-Çin ticarət dövriyyəsi ilk dörd ayda 19,7% artıb

Rusiya-Çin ticarət dövriyyəsi 2026-cı ilin yanvar-aprel aylarında ötən ilə nisbətən 19,7% artıb.
spot_img