
Polish AI better than Mark Zuckerberg’s Meta. Bielik is at the top of the world ranking from EuroEval benchmarks
https://cyfrowa.rp.pl/globalne-interesy/art43590861-polska-ai-lepsza-od-mety-marka-zuckerberga-bielik-w-czolowce-swiatowych-benchmarkow
Posted by BubsyFanboy
11 Comments
**Stworzony nad Wisłą duży model językowy, w kategorii tzw. modeli bazowych zajął w zadaniach wielojęzycznych 4. miejsce na świecie. W testach pokonał np. uznany model Llama, za którym stoi Mark Zuckerberg.**
Bielik v3, a więc najnowsza wersja sztucznej inteligencji stworzonej przez Fundację SpeakLeash, społeczność specjalistów i entuzjastów, została uwzględniona w badaniach porównawczych dla wiodących LLM-ów i wypadła zaskakująco dobrze. Mowa o benchmarkach EuroEval, platformie analizującej skuteczność i jakość modeli językowych w różnych zadaniach. W dużym uproszczeniu można powiedzieć, że testy te są niczym olimpiada dla AI. A polski model w wersji bazowej zajął 4. miejsce na świecie w zadaniach wielojęzycznych.
[](https://www.bing.com/api/v1/mediation/tracking?adUnit=1732768568&auId=e995a064-5527-4e7a-8539-191ff8173242&bdc=hx&bidId=17&bidderId=4&cmExpId=RSV&impId=1&oAdUnit=1732768568&publisherId=17160724&rId=d00ce8e4-8dba-4187-9724-83076efe59d8®ion=emea&rlink=https%3A%2F%2Fwww.bing.com%2Faclick%3Fld%3De8F_xXGNlh9Fl8NGAdTvIZzzVUCUw7-gZ2LOFwFhkEIuKL5MehOP_6ORyp6GtFiCx_rBdMnZ36XQ933SAJI1dvwHdDpZFteTeD4UN4U0ZAK5J7Bg_wZJDHRFssx9pyySReAu4wfzoAYdvb-6go2YNCwkpPd8zj1pzEQFYRHg-E2EA9j0pZ2stsDhQRJRYbkd4Ik_E_upqEGotyzdvXkjBVVcOXqlA%26u%3DaHR0cHMlM2ElMmYlMmZtb2RiaXMucGwlMmZwcm9kdWN0LXBvbC00MDU5OC1DemFybmUtcmFqc3RvcHktYmV6bWFqdGtvd2UtbmVyby04LURFTi11bHRyYWNpZW5raWUtcmFqc3RvcHktbWF0b3dlLWlkZWFsbmUtZG8tZWxlZ2FuY2tpY2gtc3R5bGl6YWNqaS00MDU5OC5odG1sJTNmbXNjbGtpZCUzZDMyODNlODMzZmU4YjExMWU4ODk5ODE2ODdjYzdlNWZjJTI2dXRtX3NvdXJjZSUzZGJpbmclMjZ1dG1fbWVkaXVtJTNkY3BjJTI2dXRtX2NhbXBhaWduJTNkMDAuMDFfU21hcnQlMjUyMFNob3BwaW5nJTI1MjBTSDAlMjZ1dG1fdGVybSUzZDIzMzUyOTM5Nzg1NjkxODUlMjZ1dG1fY29udGVudCUzZFd5YnJhbmUlMjUyMHByb2R1a3R5%26rlid%3D3283e833fe8b111e889981687cc7e5fc&rtype=targetURL&tagId=webcompar-inarticle-1&trafficGroup=zfa_angvir&trafficSubGroup=erfreir&uberGroup=hore_1c&uberSubGroup=erfreir)
# Mały model, wielki wynik
O sukcesie na platformie X poinformował Sebastian Kondracki, jeden z założycieli SpeakLeash. Jak podał, tzw. wersja instrukcyjna (nauczona reagować na polecenia), uplasowała się na 32. pozycji. Co też nie jest złym wynikiem, bo to rezultat lepszy niż osiągnęły systemy o znacznie większych mocach, w tym Nemotron (30B parametrów), OLMo (32B), czy rozwijana przez kierowany przez Marka Zuckerberga koncern Meta model Llama 3.1 (8B). Bielik, polska AI działająca w modelu open source, ma tylko 11B parametrów. „Takie wyniki aż proszą się o symboliczne docenienie zespołu trenującego. Choćby order (…)” – napisał na X Kondracki. „Jeśli uwzględnimy wyłącznie modele instrukcyjne, bez modeli wnioskujących, Bielik v3 plasuje się na 18. miejscu” – dodał.
SpeakLeash (znany również jako Spichlerz) zainicjowany został w 2022 r. Celem projektu jest umożliwienie prowadzenia badań nad modelowaniem języka i uczeniem maszynowym w języku polskim. Pierwotnym założeniem było zbudowanie zestawu danych w języku polskim dla dużego modelu językowego (LLM). Obecnie projekt koncentruje się na tworzeniu narzędzi do ewidencji, filtrowania oraz utrzymania zestawów danych tekstowych, które mogą być bezpłatnie wykorzystane do trenowania modeli sztucznej inteligencji w języku polskim. Sam Bielik AI zadebiutował w 2024 r. Model bazuje na zasobach obliczeniowych Akademickiego Centrum Komputerowego Cyfronet. Przedsięwzięcie wspiera mocno powiązana z Sebastianem Kulczykiem spółka Beyond, a także Rafał Brzoska. Dzięki temu ostatniemu, który będzie nie tylko finansowo wspierał projekt, aplikacja InPost Mobile, kojarzona dotychczas głównie z odbiorem przesyłek, stała się właśnie poligonem doświadczalnym dla polskiej AI (firma pod koniec 2025 r. ogłosi integrację z modelem Bielik, rozpoczynając akcję społeczną pod hasłem „Nakarm Bielika”). Grupa InPost w listopadzie ogłosiła, że obejmie strategiczny mecenat nad Fundacją SpeakLeash. Wsparcie zapewnić ma też Google Cloud, który znalazł się w powołanej niedawno Radzie Biznesowej Bielika.
Przynajmniej potrafimy lepszego raka stworzyć
I dobrze, dlaczego nie mamy tworzyć własnej trucizny jak USA i Chiny ją robią.
Co znaczy, że meciarze zaraz go wykupią
who would win: dziesiątki pierdolonych miliardów USD, czy język tak precyzyjny że każdy czasownik ma po 50 różnych odmian
jak mnie leczą takie nagłówki to nie mogę. Ktoś przeczyta tylko nagłówek i potem siedzą tacy na wigilii i pierdza w stołki, że „Polacy to najlepsze ai zrobili”
Ja pierdole, ile kwasu w komentarzach. Wy tak kurwa żyjecie nieszczęśliwie? Można AI nie lubić, ale też można na subreddicie o naszym kraju napisać, że dobrze, że nam coś wyszło i jest to globalnie/europejsko docenione.
🦅🦅🦅🦅🦅
Świetny wynik. Akurat wczoraj kilka razy odpaliłem go testowałem. Pozytywnie mnie zaskoczył i widzę nie tylko ja go doceniłem. Brawo my, brawo Polska.
Ciekawe jaki wynik zajęliby gdyby wyszli od czegoś nowszego od niemal archaicznego już Mistral 7B v0.2
W artykule chwalą się że Bielik ma ponad milion pobrań, wiecie gdzie można go wypróbować bo nie widzę aplikacji na sklepie na Androidzie.