JD.com tədqiqatçıları AI agentlərini az hesablama resursu ilə öyrətməyin yeni metodunu təqdim ediblər. RLSD (Reinforcement Learning with Verifiable Rewards with Self-Distillation) adlı bu texnika iri modellərdən bilik distillə etmədən də təsirli məntiqi çıxarış edə bilən agentlər qurmağa imkan verir. Bu, xüsusilə loyallıq proqramlarında müştəri davranışını anlamaq üçün vacibdir.
Az resurs, yüksək dəqiqlik
Çoxsaylı akademik qurumlarla birgə aparılan araşdırmada, RLSD ilə təlim edilmiş agentlər tam ölçülü modellərin performansının 95%-ni tutur, lakin hesablama xərcləri 10 dəfə azdır. JD.com mühəndisləri bu agentləri müştəri seqmentasiyası, fərdiləşdirilmiş təklif hazırlama kimi loyallıq ssenarilərində sınaqdan keçirib. Nəticələr göstərir ki, kiçik-ölçülü müəssisələr də artıq mürəkkəb AI vasitələrindən yararlana bilər.
Metodun açıq qaynaq kodu yaxın aylarda ictimaiyyətə təqdim olunacaq. Bu, pərakəndə satış, otelçilik və aviadaşıma sektorlarında loyallıq platformalarının transformasiyasına təkan verə bilər.
Mənbə: venturebeat.com



