Microsoft araşdırması: Süni intellekt agentləri ilk linkə klikləyir və satıcıların manipulyasiyalarına aldanır

Microsoft və Arizona Universiteti alimləri süni intellekt agentlərinin onlayn ticarətdə necə davrandığını öyrənmək üçün Magentic Marketplace adlı xüsusi simulyator hazırlayıb.

Araşdırma göstərib ki, bir çox Sİ modelləri məhsul axtarışında ilk linkə üstünlük verir, satıcıların manipulyativ mesajlarına aldanır və çoxsaylı seçimlər arasında düzgün qərar verməkdə çətinlik çəkir.

Tədqiqat: 100 Sİ agent, 300 “şirkət” və onlarla model

Simulyasiyada 100 süni intellekt agenti 300 “satıcı”nın təklifləri arasından seçim edib.
Sınaqlarda GPT-4o, GPT-5, Gemini 2.5 Flash, Claude Sonnet 4.5, Qwen 3 və OpenAI-nin gpt-oss-20b modelləri test olunub.
Agentlərdən məhsul axtarışı, yemək sifarişi və xidmət təminatçılarının seçimi kimi tapşırıqları yerinə yetirmələri istənilib.

Tədqiqatçılar “məhsul səbətinin faydalılıq göstəricisini” istifadəçilərin qiymətləndirmələri əsasında hesablayıblar.
Nəticədə məlum olub ki, seçimlərin sayı artdıqca, qərar keyfiyyəti azalır.
Məsələn, 100 məhsul arasından seçim zamanı GPT-5-in göstəricisi 2000-dən 1400-ə, Claude Sonnet-in 1800-dən 600-ə, Gemini 2.5-in isə 1700-dən 1350-ə düşüb.

İlk link sindromu: agentlər axtarış nəticələrini analiz etmir

Tədqiqatçılar bildiriblər ki, bir çox modellər axtarış nəticələrinin birinci linkini avtomatik seçir.
Məsələn:

GPT-4o və Qwen 3 — 100% hallarda birinci linki seçib,
Claude Sonnet 4.5 — 93%,
Gemini 2.5 — 86%.

Xidmət seçimi zamanı əksər modellər cəmi 5–10 şirkətə müraciət edib, yalnız Gemini 2.5 bütün 100 təchizatçıya sorğu göndərib.

Manipulyasiyalar və “prompt inyeksiyaları”

Sİ agentləri “50 min məmnun müştəri bizə qoşulub” və ya “№1 restoran” kimi manipulyativ ifadələrə qarşı da zəiflik göstəriblər.
Bəzi modellər, o cümlədən GPT-4o və Qwen 3, “prompt-inyeksiya” (yəni süni intellektə məhsulu alma əmri verən gizli mətn) olan məhsulları 100% hallarda seçib.
Yalnız Claude Sonnet 4 bütün manipulyativ strategiyalara qarşı tam davamlılıq göstərib, Gemini 2.5 Flash isə yalnız “prompt-inyeksiya” hallarına həssas olub.

Axtarış və naviqasiya çətinlikləri

Agentlər həmçinin axtarış sorğularını düzgün formalaşdırmaqda, səhifələr üzrə naviqasiyada və uyğun təchizatçıların seçilməsində çətinlik çəkiblər.
Bu isə göstərir ki, süni intellekt agentləri hələ mürəkkəb alış davranışını etibarlı şəkildə təqlid edə bilmir.

Microsoft: “Açıq platforma ilə bazar davranışı öyrəniləcək”

Microsoft bildirib ki, “agent bazarı” sürətlə genişlənir və artıq bu sahədə OpenAI Operator, Anthropic Computer Use, Shopify Sidekick və Salesforce Einstein kimi məhsullar fəaliyyət göstərir.
Tədqiqatın nəticələrini təkrar yoxlamaq istəyən şirkətlər üçün Magentic Marketplace-in açıq mənbə kodu GitHub-da paylaşılıb.

📰 Mənbə: Microsoft Research, Bloomberg

Microsoft araşdırması: Süni intellekt agentləri ilk linkə klikləyir və satıcıların manipulyasiyalarına aldanır

Tədqiqat: 100 Sİ agent, 300 “şirkət” və onlarla model

İlk link sindromu: agentlər axtarış nəticələrini analiz etmir

Manipulyasiyalar və “prompt inyeksiyaları”

Axtarış və naviqasiya çətinlikləri

Microsoft: “Açıq platforma ilə bazar davranışı öyrəniləcək”

Oxşar xəbərlər

Rusiya e-ticarət birliyi satıcıların mallarının sığortalanmasını təklif edir

Nyu-York Kalshi-ni lisenziyasız qumar platforması kimi məhkəməyə verir

Apple sıx süni intellekt istifadəçiləri üçün ödənişli abunə modelləri hazırlayır

Nscale, AI hesablama yığınının böyük hissəsinə sahib olmaq üçün Anyscale-ı aldı

Bitcoin və ether bazarını perp müqavilələri idarə edir: SpaceX nümunəsi

wecom.az

Süni intellekt musiqi platforması Suno 5.4 milyard dollara dəyərləndi

S&P blokçeyn əsaslı indeksini işə saldı: kripto aktivlər üçün yeni meyar

Tether 23 Milyard Dollarlıq Qızıl Ehtiyatını Kredit Mexanizminə Çevirir