OpenAI’ın yeni modeli olan o1 seriyasının təqdimatı haqqında təfərrüatlar.

OpenAI-ın sirli layihəsi olan Strawberry haqqında daha öncə məlumat vermişdik. İndi isə Strawberry olaraq tanınan OpenAI-ın yeni modeli olan o1 istifadəçilərin ixtiyarına təqdim olundu. Əslində, o1 bir model ailəsi kimi qarşımıza çıxır. Bu model ailəsinə o1-preview və kod yaratmaq üçün daha səmərəli və kiçik bir model olan o1-mini daxildir. Hər iki model dünən ChatGPT-də və OpenAI API vasitəsilə istifadəyə verilib.

o1-in əsas xüsusiyyətləri

Hazırda yalnız ChatGPT Plus və ya Team abunəçiləri o1-ə giriş imkanı əldə edə bilər. Korporativ və təhsil istifadəçiləri isə gələn həftənin əvvəllərində modelə giriş imkanı əldə edəcəklər.

o1-i GPT-4o ilə müqayisə etdikdə, təcrübə daha sadə görünür. Məsələn, o1 hələ ki GPT-4o kimi internetdə gəzmək və ya faylları təhlil etmək qabiliyyətinə malik deyil. Bununla belə, modelin görüntü təhlili xüsusiyyətlərinin olduğu qeyd olunmalıdır, lakin bu xüsusiyyət əlavə sınaqlar üçün müvəqqəti olaraq deaktiv edilib.

Bundan başqa, o1-in müəyyən bir sürət limiti olduğu bildirilir. o1-preview üçün həftəlik 30 mesaj, o1-mini üçün isə 50 mesaj limiti təyin edilib. Üstəlik, o1-in qiyməti diqqət çəkir. Verilən məlumata görə, API-də o1-preview üçün 1 milyon giriş tokeni üçün 15 dollar, 1 milyon çıxış tokeni üçün isə 60 dollar ödənilir. GPT-4o ilə müqayisədə, o1-preview giriş üçün 3 dəfə, çıxış üçün isə 4 dəfə daha bahalıdır.

OpenAI, ChatGPT-nin bütün pulsuz istifadəçilərinə o1-mini girişi təmin etməyi planlaşdırır. Lakin şirkət bunun üçün dəqiq bir yayım tarixi hələ müəyyən etməyib.

o1-in düşünmə qabiliyyəti

OpenAI-ın dediyinə görə, o1-i digər generativ süni intellekt modellərindən keyfiyyətcə fərqləndirən şey onun sorğulara cavab verməzdən əvvəl “düşünmə” qabiliyyətidir.

Şirkətin açıqlamasına görə, o1-in məntiqi təfəkkürünü gücləndirən əsas amillərdən biri “düşüncə zənciri” (CoT) adlanan bir maşın öyrənmə yanaşmasının istifadə edilməsidir. Bu texnika Böyük Dil Modellərinə (LLM) mürəkkəb tapşırıqları kiçik addımlara ayıraraq onları bir-bir yerinə yetirməyə imkan verir. Bir çox hallarda, mürəkkəb sorğuların bu şəkildə işlənməsi LLM-in cavablarının dəqiqliyini artırmağa kömək edir. o1-in CoT mexanizmi təkmilləşdirici öyrənmə üsulundan istifadə edərək inkişaf etdirilib.

OpenAI tədqiqatçısı Noam Brown-ın paylaşdığı məlumata görə, o1 təkmilləşdirici öyrənmə ilə öyrədilib, bu da sistemə cavab verməzdən əvvəl xüsusi düşüncə zənciri ilə düşünməyi öyrədib. Brown-ın sözlərinə görə, o1 düzgün cavab verdikdə mükafat alır, səhv etdikdə isə cəza alır.

Brown-ın dediyinə görə, OpenAI təlim prosesində yeni optimallaşdırma alqoritmi, məntiqi təfəkkür məlumatları və məntiqi təfəkkür tapşırıqları üçün uyğunlaşdırılmış elmi ədəbiyyatdan ibarət təlim məlumat dəstindən istifadə edib. Brown bütün bu işin nəticəsini belə yekunlaşdırır:

“o1 nə qədər çox düşünürsə, məntiq tələb edən tapşırıqları bir o qədər yaxşı yerinə yetirir.”

Düşünmək üçün əlavə vaxt verildikdə, o1 tapşırıqları daha hərtərəfli nəzərdən keçirə və planlama apara bilər. Həmçinin, modelin uzun müddət ərzində bir sıra hərəkətlər həyata keçirə biləcəyini və bu müddətdə bir cavaba yaxınlaşa biləcəyini əlavə etmək lazımdır.

OpenAI-ın dediyinə görə, Beynəlxalq Riyaziyyat Olimpiadası (IMO) üçün keçirilən seçim imtahanında o1 tapşırıqların 83%-ni düzgün cavablandırıb, GPT-4o isə yalnız 13%-ni cavablandırıb. Bu məqamda Google DeepMind-ın son süni intellekt modelinin həqiqi IMO yarışmasına bərabər bir yarışmada gümüş medal qazandığını qeyd etmək lazımdır. OpenAI həmçinin o1-in Codeforces olaraq tanınan onlayn proqramlaşdırma çətinlikləri turlarında iştirakçıların 89-cu faizliyinə çatdığını bildirir ki, bu da DeepMind-ın qabaqcıl sistemi AlphaCode 2-dən daha yüksək nəticə göstərir.

Başqa bir qiymətləndirmədə, o1-preview mürəkkəb elm suallarından ibarət GPQA Diamond benchmark-ını həll edib. Verilən məlumata görə, model bir sıra fizika, biologiya və kimya suallarında doktorluq dərəcəsi olan ekspertlərdən daha yüksək bal toplayıb.

OpenAI-ın dediyinə görə, o1 ümumilikdə məlumat analizi, elm və kodlaşdırma sahələrindəki problemlərdə daha yaxşı performans göstərməlidir. GitHub-a görə, süni intellekt kodlaşdırma köməkçisi olan GitHub Copilot ilə o1-in sınaqları modelin alqoritmləri və tətbiq kodunu optimallaşdırmaqda bacarıqlı olduğunu göstərir. Bundan əlavə, OpenAI-ın müqayisəsinə görə, o1 çoxdilli bacarıqlarda, xüsusən də Ərəb və Koreya dillərində GPT-4o-dan daha yaxşı nəticə göstərir.

o1-in çatışmazlıqları nələrdir?

Digər tərəfdən, OpenAI o1 bəzi hallarda digər modellərdən daha yavaş ola bilir. İstifadəçilər bildirirlər ki, o1 bəzi suallara cavab vermək üçün 10 saniyədən çox vaxt sərf edir. Bununla yanaşı, Brown o1-in bəzən tic-tac-toe oyunlarında çətinlik çəkdiyini qeyd edir. OpenAI-ın texniki məqaləsində yer alan məlumatlara görə, modeli test edənlər o1-in GPT-4o ilə müqayisədə daha çox halüsinasiya gördüyünü bildiriblər. Test istifadəçilərinin rəylərinə görə isə model bəzən bilmədiyi sualları daha az qəbul edir.

Süni intellekt modellərinin məntiqi təfəkkür metodlarını inkişaf etdirməyə çalışan yeganə şirkət OpenAI deyil. Google DeepMind tədqiqatçıları da qısa müddət əvvəl yayımladıqları bir araşdırmada modellərə daha çox hesablama vaxtı verməklə və onlara istiqamət verməklə, bu modellərin heç bir əlavə tənzimləmə edilmədən performansının əhəmiyyətli dərəcədə artırıla biləcəyini göstəriblər.

spot_imgspot_img

Oxşar xəbərlər

Tron blokçeyn yaradıcısı Skoçlu Banan əsərini fantastik qiymətə alıb

İtaliyalı konseptual rəssam Maurisio Kattelanın əsəri - divara lentlə...

“Bitcoin” yeni rekord qıraraq 97 000 dolları keçdi

"Bitcoin" dəyəri tarixi maksimumu yeniləyərək 97 000 dolları (164.9...

“Perplexity” axtarış sistemində məhsul alışı da tətbiq edəcək

Belə ki, şirkətin süni intellektlə işləyən axtarış sistemi premium...

“Mastercard Azərbaycan” COP29 öncəsi “Dayanıqlı Kartlar” proqramının qlobal icrasını sürətləndirir

Azərbaycan dayanıqlı inkişaf məqsədləri istiqamətində, xüsusilə bərpa olunan enerji...

Uzum-un elektron ticarət sahəsində dövriyyəsi 3 dəfə artıb

Uzum Market-də təqdim edilən taksit məbləği və sifarişlərin sayı...
spot_img