Remek Kinas's banner

Remek Kinas

@KinasRemek • 9,335 subscribers

AI Researcher | Bielik LLM co-creator | Kaggle Grand Master

Shorts

Optymalizuję ⚡️⚡️⚡️ więc … tradycyjnie już Windows - bye bye 👋 Fedora wleciała 💪👍💪 Benchmark dla DGX to 67 tok/sec dla GPT- OSS-20B 4bit. No to zobaczymy …. Platforma AMD w HP Z2 G1a. W środku AMD Ryzen™ Al Max+ 395 iGPU. #HP #ZbyHP #HPIncPolska #StacjeRoboczeHP [płatna współpraca]

Optymalizuję ⚡️⚡️⚡️ więc … tradycyjnie już Windows - bye bye 👋 Fedora wleciała 💪👍💪 Benchmark dla DGX to 67 tok/sec dla GPT- OSS-20B 4bit. No to zobaczymy …. Platforma AMD w HP Z2 G1a. W środku AMD Ryzen™ Al Max+ 395 iGPU. #HP #ZbyHP #HPIncPolska #StacjeRoboczeHP [płatna współpraca]

26,820 次观看

Videos

Anya Rossi

sweetdream.ai

SweetDream.ai•Sponsored•Livecam

Watch Anya Live

Anya is streaming live right now! Join her private show and enjoy exclusive content.

Exclusive private shows

1.2k viewers online

Private Show

Join now for exclusive access

Free preview available • Premium content

Zobaczcie, co przywiózł do mnie kurier. Co za premiera! 🥰Z8 Fury G5 z czterema (4x) kartami Blackwell - 4x Nvidia RTX PRO 6000 Blackwell Max-Q. Najsilniejsza workstacja AI na świecie! 4x96GB = 384GB vRAM :) pod biurkiem. 🙏 Dziękuję HP Inc Poland za wybranie mnie jako pierwszego do testów tej niesamowitej stacji roboczej. Macie jakieś pomysły na testy? #HP #ZbyHP #HPIncPolska #StacjeRoboczeHP [płatna współpraca]

Zobaczcie, co przywiózł do mnie kurier. Co za premiera! 🥰Z8 Fury G5 z czterema (4x) kartami Blackwell - 4x Nvidia RTX PRO 6000 Blackwell Max-Q. Najsilniejsza workstacja AI na świecie! 4x96GB = 384GB vRAM :) pod biurkiem. 🙏 Dziękuję HP Inc Poland za wybranie mnie jako pierwszego do testów tej niesamowitej stacji roboczej. Macie jakieś pomysły na testy? #HP #ZbyHP #HPIncPolska #StacjeRoboczeHP [płatna współpraca]

257,264 次观看 • 10 个月前

W Polsce ekscytacja „Oze sr…e”, a w San Francisco i okolicach „Waymo sr…jmo”. Śmieję się bo mój wniosek po jeżdżeniu tym wynalazkiem jest taki, że wolę niekiedy oddać się robotowi, autonomii niż człowiekowi. Ale po kolei … Autonomia wtopiła się u ulice Doliny Krzemowej. Waymo ale też inne (na razie w fazie testów) to bardzo częsty widok. W zasadzie nic specjalnego …. Widzisz albo samochód widmo - ktoś siedzi zwykle z tyłu, albo kompletne widmo … wóz samotnie jadący gdzieś … gdzie? On tylko wie. Oglądam te stwory w różnych sytuacjach - pusta ulica, zmiana organizacji ruchu i kompletny chaos przed koncertem, ruch uliczny i centrum miasta. We wszystkich tych punktach czasoprzestrzeni radzą sobie wyśmienicie. Wzorce, które łatwo dostrzec: zdecydowanie (niektórzy mówią agresja) - starają się wcisnąć na pasy między przechodniami, chcą zmieniać pasy ruchu, wykorzystują różne takie luki, widzą przestrzennie ale też czytają (napisy na drodze - gdzie zostawić miejsce wolne), przepuszczają bardzo kulturalnie samochody włączające się do ruchu (no ja bym kiwnął ręką w podziękowaniu za takie ustąpienie), współpracują. Ten ostatni element jest ciekawy - tworzą autonomiczne swarmy. Wykorzystują mądrość grupową. Widziałem takie sytuacje gdzie Waymo między sobą współgrały i przepuszczały się na wzajem. To robiło ogromne wrażenie jak same się organizowały. Z punktu widzenia AI - fajna fuzja różnych modalności - LiDAR, wizja, radar, czujki dźwięku, świadomość grupowa pojazdów.

W Polsce ekscytacja „Oze sr…e”, a w San Francisco i okolicach „Waymo sr…jmo”. Śmieję się bo mój wniosek po jeżdżeniu tym wynalazkiem jest taki, że wolę niekiedy oddać się robotowi, autonomii niż człowiekowi. Ale po kolei … Autonomia wtopiła się u ulice Doliny Krzemowej. Waymo ale też inne (na razie w fazie testów) to bardzo częsty widok. W zasadzie nic specjalnego …. Widzisz albo samochód widmo - ktoś siedzi zwykle z tyłu, albo kompletne widmo … wóz samotnie jadący gdzieś … gdzie? On tylko wie. Oglądam te stwory w różnych sytuacjach - pusta ulica, zmiana organizacji ruchu i kompletny chaos przed koncertem, ruch uliczny i centrum miasta. We wszystkich tych punktach czasoprzestrzeni radzą sobie wyśmienicie. Wzorce, które łatwo dostrzec: zdecydowanie (niektórzy mówią agresja) - starają się wcisnąć na pasy między przechodniami, chcą zmieniać pasy ruchu, wykorzystują różne takie luki, widzą przestrzennie ale też czytają (napisy na drodze - gdzie zostawić miejsce wolne), przepuszczają bardzo kulturalnie samochody włączające się do ruchu (no ja bym kiwnął ręką w podziękowaniu za takie ustąpienie), współpracują. Ten ostatni element jest ciekawy - tworzą autonomiczne swarmy. Wykorzystują mądrość grupową. Widziałem takie sytuacje gdzie Waymo między sobą współgrały i przepuszczały się na wzajem. To robiło ogromne wrażenie jak same się organizowały. Z punktu widzenia AI - fajna fuzja różnych modalności - LiDAR, wizja, radar, czujki dźwięku, świadomość grupowa pojazdów.

57,050 次观看 • 2 个月前

Kolejny etap software engineering’u 🤩 Brak kodu!!! Zamiast dawać repo z kodem przekazywać repo z wymaganiami - product requirements documentation, architecture requirements, standards w etc. Wszystko zapisane w markdown. Zero kodu. Niech odbiorca sam sobie zakoduje :) Wczoraj wieczorem skończyłem właśnie pisać takie repo (Antec - personalny system agentowy - integruje najlepsze praktyki z 16 przebadanych systemów typu Clawd). W repo jest TYLKO komplet "ludzkich" dokumentów (jak kartki zapisane z koncepcją biznesową). Bez implementacji. Założenie jest takie, że klient pobiera repo, modyfikuje pliki wymagań markdown pod swoje potrzeby (dodanie, zmiana wymagań, wymagania technologiczne - typy baz danych, język programowania, jak ma być wdrażane np. docker czy w usłudze chmurowej). Uruchamiamy Claude Code (Codex) i system ten developuje całość do wdrożenia i utworzenia CD/CI. Puściłem dzisiaj rano implementację. Claude Code chodzi w 100% autonomicznie. Zarządza contextem przez podział wszystkiego na epic oraz user stories (tak opisałem wymagania). Fazy przekazywane są za pomocą tzw. handoverów (między fazami implementacji) - plików rozgrzebanej pracy (chociaż zakładam jak w scrum, że funkcjonalność jeśli podjęta musi być zaimplementowana, przetestowana - najwyżej może być różnica w zakresie implementacji np. 80%). Oprócz tego oczywiście wszystko opisane w Dodatkowo pliki (jako lessons learned) oraz plan (do planowania kolejnych sprintów). Stan na teraz: - liczba linii kodu - 16.006 l- iczba testcasów (trzy poziomy - komponent, integracja, e2e) - 283 - work in progress - zaimplementowano fazę 1 na 4 - planowane oddanie produktu jutro nad ranem (tak szacuję) Jak skończy implementację to zdam Wam raport ile było poprawek. Cel jest taki by doprowadzić do sytuacji gdzie kopiujecie repo, robicie zmiany, uruchamiacie klienta (Codex, Claude) po jakimś czasie otrzymujecie finalny produkt. Zobaczymy czy wyjdzie.

Kolejny etap software engineering’u 🤩 Brak kodu!!! Zamiast dawać repo z kodem przekazywać repo z wymaganiami - product requirements documentation, architecture requirements, standards w etc. Wszystko zapisane w markdown. Zero kodu. Niech odbiorca sam sobie zakoduje :) Wczoraj wieczorem skończyłem właśnie pisać takie repo (Antec - personalny system agentowy - integruje najlepsze praktyki z 16 przebadanych systemów typu Clawd). W repo jest TYLKO komplet "ludzkich" dokumentów (jak kartki zapisane z koncepcją biznesową). Bez implementacji. Założenie jest takie, że klient pobiera repo, modyfikuje pliki wymagań markdown pod swoje potrzeby (dodanie, zmiana wymagań, wymagania technologiczne - typy baz danych, język programowania, jak ma być wdrażane np. docker czy w usłudze chmurowej). Uruchamiamy Claude Code (Codex) i system ten developuje całość do wdrożenia i utworzenia CD/CI. Puściłem dzisiaj rano implementację. Claude Code chodzi w 100% autonomicznie. Zarządza contextem przez podział wszystkiego na epic oraz user stories (tak opisałem wymagania). Fazy przekazywane są za pomocą tzw. handoverów (między fazami implementacji) - plików rozgrzebanej pracy (chociaż zakładam jak w scrum, że funkcjonalność jeśli podjęta musi być zaimplementowana, przetestowana - najwyżej może być różnica w zakresie implementacji np. 80%). Oprócz tego oczywiście wszystko opisane w Dodatkowo pliki (jako lessons learned) oraz plan (do planowania kolejnych sprintów). Stan na teraz: - liczba linii kodu - 16.006 l- iczba testcasów (trzy poziomy - komponent, integracja, e2e) - 283 - work in progress - zaimplementowano fazę 1 na 4 - planowane oddanie produktu jutro nad ranem (tak szacuję) Jak skończy implementację to zdam Wam raport ile było poprawek. Cel jest taki by doprowadzić do sytuacji gdzie kopiujecie repo, robicie zmiany, uruchamiacie klienta (Codex, Claude) po jakimś czasie otrzymujecie finalny produkt. Zobaczymy czy wyjdzie.

52,000 次观看 • 3 个月前

🇵🇱 Dzisiaj stworzyłem Claude Code Math Prover (13-minutowy film pokazuje jak to działa). Claude Code Opus 4.6 orkiestruje cały przepływ pracy. Deleguje podzadania do różnych agentów: - OpenAI Codex 5.3 (badacz, rozwiązuje, recenzent) - jak widać można używać równolegle i Codex'a i Claude Code. - Claude Code (planista, rozwiązuje). - Wykorzystuje MCP poprzez lean-lsp-mcp dowodzenie twierdzeń za pomocą Lean. Używam Team Agents z tmux do pokazania jak Claude Code deleguje zadania do Codex i do siebie ale do subagentów. SKILL - codex - napisałem skilla do orkiestracji Codex'a -------------------- 🇬🇧Claude Code Math Prover (13-minute video) I made today. Claude Code Opus 4.6 orchestrates the workflow. It delegates subtasks to different agents: - OpenAI Codex 5.3 (researcher, solver, reviewer) - so we can use both solution Codex ad Claude Code - Claude Code (planner, solver). - It uses MCP via lean-lsp-mcp, which enables agentic interaction with the Lean theorem prover. I use Claude Code team agents for this task so you can see how Claude Code delegate all task. SKILL - I wrote skill for codex orchestration

🇵🇱 Dzisiaj stworzyłem Claude Code Math Prover (13-minutowy film pokazuje jak to działa). Claude Code Opus 4.6 orkiestruje cały przepływ pracy. Deleguje podzadania do różnych agentów: - OpenAI Codex 5.3 (badacz, rozwiązuje, recenzent) - jak widać można używać równolegle i Codex'a i Claude Code. - Claude Code (planista, rozwiązuje). - Wykorzystuje MCP poprzez lean-lsp-mcp dowodzenie twierdzeń za pomocą Lean. Używam Team Agents z tmux do pokazania jak Claude Code deleguje zadania do Codex i do siebie ale do subagentów. SKILL - codex - napisałem skilla do orkiestracji Codex'a -------------------- 🇬🇧Claude Code Math Prover (13-minute video) I made today. Claude Code Opus 4.6 orchestrates the workflow. It delegates subtasks to different agents: - OpenAI Codex 5.3 (researcher, solver, reviewer) - so we can use both solution Codex ad Claude Code - Claude Code (planner, solver). - It uses MCP via lean-lsp-mcp, which enables agentic interaction with the Lean theorem prover. I use Claude Code team agents for this task so you can see how Claude Code delegate all task. SKILL - I wrote skill for codex orchestration

46,560 次观看 • 4 个月前

Jak szukacie czegoś na weekend i na wiele, wiele nocy to polecam coś nad czym przesiedziałem ostatnie ... 2-3 miesiące. MADL - Model Architecture Description Language. #1/2 16 architektur modeli, 197 rodziałów książki opisujących różne aspekty architektur modeli językowych i multimodalnych, formalizacja opisu architektur modeli językowych, możliwości porównań architektur itd. Moim zdaniem jest to obecnie największe i najpełniejsze źródło wiedzy na temat archtektur modeli jakie stworzono. Koncepcja, pomysł, wybór tematów - człowiek w 100%. Pisanie artykułów system agentowy wraz z pętlą samokorekty, systemem genetycznym do zmiany promtów itd. Uwaga! "Work in progress" - mogą być jeszcze błędy, nieścisłości. Przewiduję, ze całość zakończę za jakieś 2-3 miesiące (wersja już całkowicie po korektach). Postanowiłem jednak dzisiaj to udostępnić by zbierać info zwrotne, poprawiać itd. Link w pierwszym poście pod.

Jak szukacie czegoś na weekend i na wiele, wiele nocy to polecam coś nad czym przesiedziałem ostatnie ... 2-3 miesiące. MADL - Model Architecture Description Language. #1/2 16 architektur modeli, 197 rodziałów książki opisujących różne aspekty architektur modeli językowych i multimodalnych, formalizacja opisu architektur modeli językowych, możliwości porównań architektur itd. Moim zdaniem jest to obecnie największe i najpełniejsze źródło wiedzy na temat archtektur modeli jakie stworzono. Koncepcja, pomysł, wybór tematów - człowiek w 100%. Pisanie artykułów system agentowy wraz z pętlą samokorekty, systemem genetycznym do zmiany promtów itd. Uwaga! "Work in progress" - mogą być jeszcze błędy, nieścisłości. Przewiduję, ze całość zakończę za jakieś 2-3 miesiące (wersja już całkowicie po korektach). Postanowiłem jednak dzisiaj to udostępnić by zbierać info zwrotne, poprawiać itd. Link w pierwszym poście pod.

20,836 次观看 • 2 个月前

Mnie się podoba i to bardzo ❤️ Ale zasuwa ⚡️⚡️⚡️i to nasz Bielik 🦅 Bielik AI w apce Paczkomat, Kurier Rafał Brzoska Sebastian 💪

Mnie się podoba i to bardzo ❤️ Ale zasuwa ⚡️⚡️⚡️i to nasz Bielik 🦅 Bielik AI w apce Paczkomat, Kurier Rafał Brzoska Sebastian 💪

46,144 次观看 • 5 个月前

20 minut porządnego w pełni autonomicznego 🕵️🤖🤖🤖🤖 kodowania za pomocą AGENT TEAMS (wszystkie sesje agentów równolegle widać dzięki tmux - super się to ogląda jak ze sobą współpracują). Robi niesamowite wrażenie 😍🥰 Claude Code Opus 4.6 😻 5 agentów tworzących grę TETRIS ... (architekt, developer, tester ...) łącznie z automatycznymi testami gry w przeglądarce (agent sam gra i sprawdza poprawność implementacji funkcjonalności). Dzisiaj to tak wygląda. Za pół roku ... nawet nie chcę myśleć co będzie. Siedziałem przed komputerem i tylko obserwowałem. Jedna uwaga? Pewnie rozwiązanie to wymaga optymalizacji (dużo tokenów idzie) ale ... możliwość tworzenia agentów w locie na podstawie promptu - SZOK! Jutro dorzucę jeszcze definicję subagentów. skills tylko do Plywright - reszta w czystym Claude Code z włączoną eksperymentalną funkcją agent teams i automatycznym zatwierdzaniem.

20 minut porządnego w pełni autonomicznego 🕵️🤖🤖🤖🤖 kodowania za pomocą AGENT TEAMS (wszystkie sesje agentów równolegle widać dzięki tmux - super się to ogląda jak ze sobą współpracują). Robi niesamowite wrażenie 😍🥰 Claude Code Opus 4.6 😻 5 agentów tworzących grę TETRIS ... (architekt, developer, tester ...) łącznie z automatycznymi testami gry w przeglądarce (agent sam gra i sprawdza poprawność implementacji funkcjonalności). Dzisiaj to tak wygląda. Za pół roku ... nawet nie chcę myśleć co będzie. Siedziałem przed komputerem i tylko obserwowałem. Jedna uwaga? Pewnie rozwiązanie to wymaga optymalizacji (dużo tokenów idzie) ale ... możliwość tworzenia agentów w locie na podstawie promptu - SZOK! Jutro dorzucę jeszcze definicję subagentów. skills tylko do Plywright - reszta w czystym Claude Code z włączoną eksperymentalną funkcją agent teams i automatycznym zatwierdzaniem.

29,904 次观看 • 4 个月前

Apel ✅🌐 Artemis II - dzisiaj jedno z największych wydarzeń jakie mogą inspirować młodych, nas wszystkich do tego by świat czynić lepszym, ciekawszym, bardziej wartościowym. By promować naukę, inżynierię, to co człowiek potrafi stworzyć a nie to co człowiek potrafi zniszczyć. Zrobiłem przegląd 4 najważniejszych mediów internetowych Onet, Gazeta Wyborcza, Rzeczpospolita, Wirtualna Polska - pytanie brzmiało ile poświęcono dzisiaj przestrzeni internetowej dla Artemis II. A mówi się, że media kształtują nasze społeczeństwo .... Onet Wiadomości Gazeta Wyborcza.pl Rzeczpospolita Wirtualna Polska dajcie proszę info o harmonogramie i o wydarzeniu - poproszę - wziąłem poniższe wpisy od Hubert Kijek Dzisiejsze rekordy: - Pobicie rekordu odległości Astronauci znajdą się dalej od Ziemi niż jakikolwiek człowiek w historii - Największe zbliżenie Oriona do Księżyca Punkt kulminacyjny manewru, tzw. peryselenium - Orion osiąga maksymalną odległość od Ziemi Punkt na trajektorii lotu - Orion wchodzi w strefę zaćmienia Słońca przez Księżyc Hubert Kijek Maciej Kawecki - This Is IT Łukasz Olejnik Artur Kurasiński ⚡ Tomek Czajka Andrzej Dragan Bartosz Naskręcki Piotr Sankowski Sławosz Uznański-Wiśniewski Patrycjusz Wyżga Space24

Apel ✅🌐 Artemis II - dzisiaj jedno z największych wydarzeń jakie mogą inspirować młodych, nas wszystkich do tego by świat czynić lepszym, ciekawszym, bardziej wartościowym. By promować naukę, inżynierię, to co człowiek potrafi stworzyć a nie to co człowiek potrafi zniszczyć. Zrobiłem przegląd 4 najważniejszych mediów internetowych Onet, Gazeta Wyborcza, Rzeczpospolita, Wirtualna Polska - pytanie brzmiało ile poświęcono dzisiaj przestrzeni internetowej dla Artemis II. A mówi się, że media kształtują nasze społeczeństwo .... Onet Wiadomości Gazeta Wyborcza.pl Rzeczpospolita Wirtualna Polska dajcie proszę info o harmonogramie i o wydarzeniu - poproszę - wziąłem poniższe wpisy od Hubert Kijek Dzisiejsze rekordy: - Pobicie rekordu odległości Astronauci znajdą się dalej od Ziemi niż jakikolwiek człowiek w historii - Największe zbliżenie Oriona do Księżyca Punkt kulminacyjny manewru, tzw. peryselenium - Orion osiąga maksymalną odległość od Ziemi Punkt na trajektorii lotu - Orion wchodzi w strefę zaćmienia Słońca przez Księżyc Hubert Kijek Maciej Kawecki - This Is IT Łukasz Olejnik Artur Kurasiński ⚡ Tomek Czajka Andrzej Dragan Bartosz Naskręcki Piotr Sankowski Sławosz Uznański-Wiśniewski Patrycjusz Wyżga Space24

16,840 次观看 • 2 个月前

Bielik AI 11B v3.0 - nasz krok ku Europie. Bielik obsługuje 30+ języków europejskich. Topowe wyniki w 17 krajach. Lider w 8 językach testów wiedzy regionalnej. A to przypominam nadal modelik 11B.

Bielik AI 11B v3.0 - nasz krok ku Europie. Bielik obsługuje 30+ języków europejskich. Topowe wyniki w 17 krajach. Lider w 8 językach testów wiedzy regionalnej. A to przypominam nadal modelik 11B.

36,113 次观看 • 6 个月前

Obiecałem napisać o pre-prototypie Bielik-11B-R1 🦅 (nazwany przeze mnie alpha) :) Celem eksperymentu R&D SpeakLeash | Spichlerz było sprawdzenie na ile wykonalny jest trening Bielika-11B w formule DeepSeek-Zero (czyli tylko RL -GRPO). Zrobiliśmy to! Wiązało się to z przygotowaniem odpowiedniego datasetu, walidatorów oraz treningu. I teraz ... wstępne myśli: *️⃣ Przetrenowaliśmy dwa modele Bielik-1.5-mini oraz Bielik-11B w pełni po polsku (polskie dane, polskie promptowanie modelu tak by model "myślał" po polsku). Nie ma destylatów z R1 - mamy zadanie oraz polityki (sprawdzają poprawność odpowiedzi modelu i na tej postawie model otrzymuje "nagrodę" albo "karę" jednocześnie pilnując by model nie "odleciał" w kierunku nagród - ma być blisko oryginalnego modelu ale jednak zachowywać się trochę inaczej - "myśleć"). *️⃣ Wiele obecnie trenowanych modeli (tych pokazywanych jako demo) ma bardzo ograniczone możliwości (ograniczają się do prostych zadań i jednorodnych) - DeepSeek zrobił OGROMNĄ pracę by generalizować liczbę zastosowań (myśli w zadaniach matematycznych, w testach, zagadkach logicznych, medycynie itd). *️⃣ Droga do przygotowania takiego modelu wymaga sporego nakładu pracy na przygotowanie zdywersyfikowanych datasetów (mnie się udało dosłownie dotknąć kilkunastu różnych typów w zakresie reasoningu ale to kropla w morzu - nadal są jednolite i ograniczają się do prostych sposobów walidacji) oraz wymyślenie sposobu walidacji prawidłowości odpowiedzi (to Verifiable Reinforcement Learning) - tzw. oracle (może być reguła jeśli się da lub metamodel). *️⃣ Zaskakujące jest jak model sam z siebie kombinuje by "odkryć" i dopasować się do reguł (policy) - to otwiera ogromny obszar do badań związanych z tym jak budować polityki RL (pewnie można kilka doktoratów na tym zrobić) - poprawność odpowiedzi, styl odpowiedzi, "a'ha momenty", weryfikacje odpowiedzi itd. *️⃣ Z "pamiętnika" treningowego (logów treningu) widać jak na początku model nie bardzo wie jak nauczyć się "rozumowania" - reward=0, loss=0, KL=0 po czym następuje punkt przełomowy - model generuje jedną odpowiedź, która jest "blisko" polityk i następuje moment "olśnienia" i podążanie za danym przykładem - od tego momentu mózg ożywa :) *️⃣Im dalej model się uczy tym widać, że optymalizuje długość procesu myślowego (thinking się skraca, staje się ubogi - więc szacun dla DeepSeek, że u nich to jest takie obszerne). *️⃣Im większy model (testowałem R1 na Bieliku-1.5-mini oraz na 11B) tym pełniejsze i bardziej rozbudowane ciągi myśli - kusi mnie by puścić na jeszcze większym modelu. *️⃣ Ogólnie metoda GRPO wymaga dużych zasobów, jest stosunkowo wolna ponieważ musimy generować w locie odpowiedzi modelu (by stworzyć grupę odpowiedzi i ją ocenić). *️⃣ Śmieszne ale nie widziałem w logach momentów "a-ha", o których pisze DeepSeek - może w polskim ich nie ma? :) A może są ale nie znalazłem ich podczas poszukiwania odpowiedzi modelu. Być może zadania były zbyt proste. Na pewno sprawdzimy.

Obiecałem napisać o pre-prototypie Bielik-11B-R1 🦅 (nazwany przeze mnie alpha) :) Celem eksperymentu R&D SpeakLeash | Spichlerz było sprawdzenie na ile wykonalny jest trening Bielika-11B w formule DeepSeek-Zero (czyli tylko RL -GRPO). Zrobiliśmy to! Wiązało się to z przygotowaniem odpowiedniego datasetu, walidatorów oraz treningu. I teraz ... wstępne myśli: ️⃣ Przetrenowaliśmy dwa modele Bielik-1.5-mini oraz Bielik-11B w pełni po polsku (polskie dane, polskie promptowanie modelu tak by model "myślał" po polsku). Nie ma destylatów z R1 - mamy zadanie oraz polityki (sprawdzają poprawność odpowiedzi modelu i na tej postawie model otrzymuje "nagrodę" albo "karę" jednocześnie pilnując by model nie "odleciał" w kierunku nagród - ma być blisko oryginalnego modelu ale jednak zachowywać się trochę inaczej - "myśleć"). ️⃣ Wiele obecnie trenowanych modeli (tych pokazywanych jako demo) ma bardzo ograniczone możliwości (ograniczają się do prostych zadań i jednorodnych) - DeepSeek zrobił OGROMNĄ pracę by generalizować liczbę zastosowań (myśli w zadaniach matematycznych, w testach, zagadkach logicznych, medycynie itd). ️⃣ Droga do przygotowania takiego modelu wymaga sporego nakładu pracy na przygotowanie zdywersyfikowanych datasetów (mnie się udało dosłownie dotknąć kilkunastu różnych typów w zakresie reasoningu ale to kropla w morzu - nadal są jednolite i ograniczają się do prostych sposobów walidacji) oraz wymyślenie sposobu walidacji prawidłowości odpowiedzi (to Verifiable Reinforcement Learning) - tzw. oracle (może być reguła jeśli się da lub metamodel). ️⃣ Zaskakujące jest jak model sam z siebie kombinuje by "odkryć" i dopasować się do reguł (policy) - to otwiera ogromny obszar do badań związanych z tym jak budować polityki RL (pewnie można kilka doktoratów na tym zrobić) - poprawność odpowiedzi, styl odpowiedzi, "a'ha momenty", weryfikacje odpowiedzi itd. ️⃣ Z "pamiętnika" treningowego (logów treningu) widać jak na początku model nie bardzo wie jak nauczyć się "rozumowania" - reward=0, loss=0, KL=0 po czym następuje punkt przełomowy - model generuje jedną odpowiedź, która jest "blisko" polityk i następuje moment "olśnienia" i podążanie za danym przykładem - od tego momentu mózg ożywa :) ️⃣Im dalej model się uczy tym widać, że optymalizuje długość procesu myślowego (thinking się skraca, staje się ubogi - więc szacun dla DeepSeek, że u nich to jest takie obszerne). ️⃣Im większy model (testowałem R1 na Bieliku-1.5-mini oraz na 11B) tym pełniejsze i bardziej rozbudowane ciągi myśli - kusi mnie by puścić na jeszcze większym modelu. ️⃣ Ogólnie metoda GRPO wymaga dużych zasobów, jest stosunkowo wolna ponieważ musimy generować w locie odpowiedzi modelu (by stworzyć grupę odpowiedzi i ją ocenić). *️⃣ Śmieszne ale nie widziałem w logach momentów "a-ha", o których pisze DeepSeek - może w polskim ich nie ma? :) A może są ale nie znalazłem ich podczas poszukiwania odpowiedzi modelu. Być może zadania były zbyt proste. Na pewno sprawdzimy.

71,383 次观看 • 1 年前

Andrzej Dragan Andrzej Dragan wyjaśnienie publikacji :)

Andrzej Dragan Andrzej Dragan wyjaśnienie publikacji :)

21,838 次观看 • 3 个月前

Jak ze stacji roboczej HP - Z6 zrobić środowisko do vibe codingu? Przepis jest prosty - stacja robocza z 1x GPU (akurat moja posiada 2x Nvidia RTX PRO 6000 Blackewell Max-Q), lokalna instalacja vllm'a albo SGLang, najnowszy model Qwen3-Coder-30B-A3B-Instruct i żegnajcie limity, ograniczenia, płatności. 100% lokalnie, bez przekazywania danych, bezpiecznie. Zobaczmy, czy dzięki takiej stacji kilka osób jest w stanie pracować lokalnie. Oczywiście opencode. #HP #ZbyHP #HPIncPolska #StacjeRoboczeHP [płatna współpraca]

Jak ze stacji roboczej HP - Z6 zrobić środowisko do vibe codingu? Przepis jest prosty - stacja robocza z 1x GPU (akurat moja posiada 2x Nvidia RTX PRO 6000 Blackewell Max-Q), lokalna instalacja vllm'a albo SGLang, najnowszy model Qwen3-Coder-30B-A3B-Instruct i żegnajcie limity, ograniczenia, płatności. 100% lokalnie, bez przekazywania danych, bezpiecznie. Zobaczmy, czy dzięki takiej stacji kilka osób jest w stanie pracować lokalnie. Oczywiście opencode. #HP #ZbyHP #HPIncPolska #StacjeRoboczeHP [płatna współpraca]

21,466 次观看 • 3 个月前

Zobaczmy, co tam w środku mojej nowej stacji roboczej Z by HP Z6 G5 A... „A”, czyli AMD. Nie można tego określić mianem skromnej konfiguracji. Zacznijmy od „A” - maksymalnie 96 cores AMD Ryzen™ Threadripper™ PRO 7995WX. Czyli do dyspozycji mamy 192 wątki. Pięknie! Wszystkie zadania na CPU, które da się zrównoleglić zyskają nowe przyspieszenie. Oczywiście moje ulubione (na dzisiaj) karty RTX 6000 Ada. Sztuk dwie, ale z możliwością rozbudowy do trzech. Pamięć? Max 1 TB RAM (u mnie 256GB) oraz 8 TB na dyskach SDD (w sumie może być nawet i 88 TB). Jak działa? Jakie pierwsze odczucia po dwóch tygodniach pracy? Cierpliwości... Dzisiaj napiszę tyle. Pięknie. Szczegóły w kolejnym wpisie. #HP #ZbyHP #HPIncPolska #StacjeRoboczeHP [płatna współpraca]

Zobaczmy, co tam w środku mojej nowej stacji roboczej Z by HP Z6 G5 A... „A”, czyli AMD. Nie można tego określić mianem skromnej konfiguracji. Zacznijmy od „A” - maksymalnie 96 cores AMD Ryzen™ Threadripper™ PRO 7995WX. Czyli do dyspozycji mamy 192 wątki. Pięknie! Wszystkie zadania na CPU, które da się zrównoleglić zyskają nowe przyspieszenie. Oczywiście moje ulubione (na dzisiaj) karty RTX 6000 Ada. Sztuk dwie, ale z możliwością rozbudowy do trzech. Pamięć? Max 1 TB RAM (u mnie 256GB) oraz 8 TB na dyskach SDD (w sumie może być nawet i 88 TB). Jak działa? Jakie pierwsze odczucia po dwóch tygodniach pracy? Cierpliwości... Dzisiaj napiszę tyle. Pięknie. Szczegóły w kolejnym wpisie. #HP #ZbyHP #HPIncPolska #StacjeRoboczeHP [płatna współpraca]

37,172 次观看 • 10 个月前

Wczorajszy wpis "System bez kodu" cieszył się dużym zainteresowaniem. Zobaczcie zatem jak to wygląda od środka. Pokazuję elementy składowe i definicje (by pokazać, że kodowanie z AI to nie naiwne wrzucanie promptu "Zrób mi system" i czekanie na cud): - TODO - aktualna lista do zrobienia - waves list (fazy dzielone są na fale) - Taski - fazy oraz user stories - UI - są schematy stron (zwykle robię je w Figma i integruję się po MCP - tutaj założyłem, że ktoś kto weźmie specyfikację może nie znać Figmy więc są screeny w ascii) - Handover - po zakończeniu Wave zapisywana jest praca (wiedza dla CLI jak kontynuować) - Architektura - wytyczne architektoniczne - Toole - jakie toole planuję w systemie ziamplementować - Skille - jakie skille chcę zaimplementować - Lessons Learned - lekcje wyciągnięte podczas implementacji - Memory management - jak zaimplementować zaawansowany system zarządzania pamięcią w systemie agentowym niestety zapomniałem nagrać CLAUDE (makdown) - przy okazji pokażę.

Wczorajszy wpis "System bez kodu" cieszył się dużym zainteresowaniem. Zobaczcie zatem jak to wygląda od środka. Pokazuję elementy składowe i definicje (by pokazać, że kodowanie z AI to nie naiwne wrzucanie promptu "Zrób mi system" i czekanie na cud): - TODO - aktualna lista do zrobienia - waves list (fazy dzielone są na fale) - Taski - fazy oraz user stories - UI - są schematy stron (zwykle robię je w Figma i integruję się po MCP - tutaj założyłem, że ktoś kto weźmie specyfikację może nie znać Figmy więc są screeny w ascii) - Handover - po zakończeniu Wave zapisywana jest praca (wiedza dla CLI jak kontynuować) - Architektura - wytyczne architektoniczne - Toole - jakie toole planuję w systemie ziamplementować - Skille - jakie skille chcę zaimplementować - Lessons Learned - lekcje wyciągnięte podczas implementacji - Memory management - jak zaimplementować zaawansowany system zarządzania pamięcią w systemie agentowym niestety zapomniałem nagrać CLAUDE (makdown) - przy okazji pokażę.

15,430 次观看 • 3 个月前

Inside NVIDIA HQ 🤩 Czy chcielibyście pracować w takich warunkach? Nagrałem wczoraj - zobaczycie wnętrze dwóch najnowszych budynków - Endeavor i Voyager. Od miejsca, w którym pracownicy spotykają się na świeżym powietrzu, poprzez centrum konferencyjne, miejsce spotkań, sale inżynierskie aż do stołówki. Zapraszam do podróży po centrali Nvidia. To tutaj rodzi się zaawansowana technologia, AI.

Inside NVIDIA HQ 🤩 Czy chcielibyście pracować w takich warunkach? Nagrałem wczoraj - zobaczycie wnętrze dwóch najnowszych budynków - Endeavor i Voyager. Od miejsca, w którym pracownicy spotykają się na świeżym powietrzu, poprzez centrum konferencyjne, miejsce spotkań, sale inżynierskie aż do stołówki. Zapraszam do podróży po centrali Nvidia. To tutaj rodzi się zaawansowana technologia, AI.

13,192 次观看 • 2 个月前

Na telefonie (albo za pośrednictwem telefonu)też fajnie działa Claude Code … Można coś tam na wyjeździe skrobnąć. Mając taką uConsole to pewnie dałoby się pełen development zrobić.

Na telefonie (albo za pośrednictwem telefonu)też fajnie działa Claude Code … Można coś tam na wyjeździe skrobnąć. Mając taką uConsole to pewnie dałoby się pełen development zrobić.

14,367 次观看 • 4 个月前

Bielik-1.5B mini na start! Przepremierowo – przetwarzanie na CPU, lokalnie, bezpiecznie, bez potrzeby korzystania z Internetu. Komputer? Notebook HP EliteBook x360 830 G11. Czy da radę w formie czatu (zwykle większe modele przystosowane są do takich zadań)? My polecamy Bielika-1.5B do wąskich zastosowań po fine-tuningu. Będzie świetny do NER (Named Entity Recognition), wyłapywania numerów zamówień, numerów faktur, klasyfikacji sentymentu, intencji na tekstach z chatbot'a lub voice-bot'a (po konwersji dźwięku na tekst). I najmocniejszy maluch (mini model) w języku polskim. #HP #ZbyHP #HPIncPolska #StacjeRoboczeHP #EliteBook [płatna współpraca]

Bielik-1.5B mini na start! Przepremierowo – przetwarzanie na CPU, lokalnie, bezpiecznie, bez potrzeby korzystania z Internetu. Komputer? Notebook HP EliteBook x360 830 G11. Czy da radę w formie czatu (zwykle większe modele przystosowane są do takich zadań)? My polecamy Bielika-1.5B do wąskich zastosowań po fine-tuningu. Będzie świetny do NER (Named Entity Recognition), wyłapywania numerów zamówień, numerów faktur, klasyfikacji sentymentu, intencji na tekstach z chatbot'a lub voice-bot'a (po konwersji dźwięku na tekst). I najmocniejszy maluch (mini model) w języku polskim. #HP #ZbyHP #HPIncPolska #StacjeRoboczeHP #EliteBook [płatna współpraca]

34,693 次观看 • 1 年前

Serce nowej stacji Z8 Fury G5 - to, co najważniejsze dla tych, którzy zajmują się AI - GPU. To tam zrównoleglamy pracę. To tam ją akcelerujemy. Tak wygląda jedna karta Nvidia RTX PRO 6000 Blackwell Max-Q. Blackwell - więcej pamięci VRAM 96GB, chip GB202, 24064 core, pasmo 1.79 TB/s, co jest bardzo ważne w przypadku treningu i inferencji LLM'ów (cały czas to właśnie prędkość transferu pamięci jest ograniczeniem w tym zadaniu), FP16 (half) 110.1 TFLOPS, oczywiście sprzętowe wsparcie fp8 i fp4. #HP #ZbyHP #HPIncPolska #StacjeRoboczeHP [płatna współpraca]

Serce nowej stacji Z8 Fury G5 - to, co najważniejsze dla tych, którzy zajmują się AI - GPU. To tam zrównoleglamy pracę. To tam ją akcelerujemy. Tak wygląda jedna karta Nvidia RTX PRO 6000 Blackwell Max-Q. Blackwell - więcej pamięci VRAM 96GB, chip GB202, 24064 core, pasmo 1.79 TB/s, co jest bardzo ważne w przypadku treningu i inferencji LLM'ów (cały czas to właśnie prędkość transferu pamięci jest ograniczeniem w tym zadaniu), FP16 (half) 110.1 TFLOPS, oczywiście sprzętowe wsparcie fp8 i fp4. #HP #ZbyHP #HPIncPolska #StacjeRoboczeHP [płatna współpraca]

21,258 次观看 • 8 个月前

Przyszły do mnie, do testów, ostatecznie dwie stacje robocze. Tak! Nie jedna - Z8 Fury G5 z 4x Nvidia RTX PRO 6000 Blackewell Max-Q. Druga to skromniejsza :) na AMD Ryzen Pro 7995WX i z 2x Blackwell - RTX PRO 6000 Max-Q stacja robocza ZbyHP Z6 G5 A. Na Z8 lecą już modele, kilkadziesiąt wytrenowanych ... jest potęga. Zerknijcie jak to wygląda w środku. Inżynieria TOP. Wielkie podziękowania za możliwość uczestniczenia w programie ambasadorskim Z by HP. Dzisiaj chyba nie zasnę... Idę uruchamiać komputery i testować moje AI :) #HP #ZbyHP #HPIncPolska #StacjeRoboczeHP [płatna współpraca]

Przyszły do mnie, do testów, ostatecznie dwie stacje robocze. Tak! Nie jedna - Z8 Fury G5 z 4x Nvidia RTX PRO 6000 Blackewell Max-Q. Druga to skromniejsza :) na AMD Ryzen Pro 7995WX i z 2x Blackwell - RTX PRO 6000 Max-Q stacja robocza ZbyHP Z6 G5 A. Na Z8 lecą już modele, kilkadziesiąt wytrenowanych ... jest potęga. Zerknijcie jak to wygląda w środku. Inżynieria TOP. Wielkie podziękowania za możliwość uczestniczenia w programie ambasadorskim Z by HP. Dzisiaj chyba nie zasnę... Idę uruchamiać komputery i testować moje AI :) #HP #ZbyHP #HPIncPolska #StacjeRoboczeHP [płatna współpraca]

19,609 次观看 • 9 个月前

Sylwestrowe kodowanie nie jest złe ... 🥳 2500 cząsteczek z własnym DNA (kolor, rozmiar, zachowanie) rozpoczyna w całkowitym chaosie. Każda ma przypisany cel - punkt w napisie "2026". Stopniowo, jak w prawdziwej ewolucji, z chaosu wyłania się porządek. Fazy: - CHAOS - cząsteczki błądzą losowo, zachodzą intensywne mutacje - EWOLUCJA - pojawia się słabe "przyciąganie" do celów, cząsteczki zaczynają wędrować organicznymi trajektoriami - KONWERGENCJA - ruch staje się coraz bardziej uporządkowany - STABILIZACJA - napis "2026" jest gotowy Każdy organizm posiada genom z kilkoma genami: - Barwa, nasycenie, jasność - determinują kolor - Rozmiar - jak duży jest organizm - Prędkość - jak szybko się porusza - Metabolizm - jak efektywnie zbiera energię z odbić - Płodność - jak łatwo osiąga próg podziału - Długość życia - ile sekund przeżyje Zbieranie energii - Organizmy odbijają się od ścian i liter napisu "2026" - każde odbicie to źródło energii - jak jedzenie dla komórki. Żółty pasek pod organizmem pokazuje poziom energii. - Mitoza (podział komórkowy) - gdy organizm zbierze wystarczająco dużo energii, dzieli się na dwa potomki: Rodzic "umiera" (transformuje się): - Powstają dwoje dzieci, każde z 75% rozmiaru rodzica - Potomkowie dziedziczą DNA z mutacjami - mogą mieć inny kolor, prędkość, metabolizm... - Dzieci rozlatują się w przeciwnych kierunkach Starzenie i śmierć: - Każdy organizm ma ograniczoną długość życia (gen lifespan, średnio ~20 sekund): - Po 70% życia zaczyna się starzenie - organizm blednie, zwalnia, zbiera mniej energii - Po 80% życia nie może się już rozmnażać - Na końcu życia organizm umiera - kurczy się, wypuszcza iskry unoszące się w górę (dusza!), i znika - Zielony pasek pod organizmem pokazuje pozostałe życie (zielony → żółty → czerwony)

Sylwestrowe kodowanie nie jest złe ... 🥳 2500 cząsteczek z własnym DNA (kolor, rozmiar, zachowanie) rozpoczyna w całkowitym chaosie. Każda ma przypisany cel - punkt w napisie "2026". Stopniowo, jak w prawdziwej ewolucji, z chaosu wyłania się porządek. Fazy: - CHAOS - cząsteczki błądzą losowo, zachodzą intensywne mutacje - EWOLUCJA - pojawia się słabe "przyciąganie" do celów, cząsteczki zaczynają wędrować organicznymi trajektoriami - KONWERGENCJA - ruch staje się coraz bardziej uporządkowany - STABILIZACJA - napis "2026" jest gotowy Każdy organizm posiada genom z kilkoma genami: - Barwa, nasycenie, jasność - determinują kolor - Rozmiar - jak duży jest organizm - Prędkość - jak szybko się porusza - Metabolizm - jak efektywnie zbiera energię z odbić - Płodność - jak łatwo osiąga próg podziału - Długość życia - ile sekund przeżyje Zbieranie energii - Organizmy odbijają się od ścian i liter napisu "2026" - każde odbicie to źródło energii - jak jedzenie dla komórki. Żółty pasek pod organizmem pokazuje poziom energii. - Mitoza (podział komórkowy) - gdy organizm zbierze wystarczająco dużo energii, dzieli się na dwa potomki: Rodzic "umiera" (transformuje się): - Powstają dwoje dzieci, każde z 75% rozmiaru rodzica - Potomkowie dziedziczą DNA z mutacjami - mogą mieć inny kolor, prędkość, metabolizm... - Dzieci rozlatują się w przeciwnych kierunkach Starzenie i śmierć: - Każdy organizm ma ograniczoną długość życia (gen lifespan, średnio ~20 sekund): - Po 70% życia zaczyna się starzenie - organizm blednie, zwalnia, zbiera mniej energii - Po 80% życia nie może się już rozmnażać - Na końcu życia organizm umiera - kurczy się, wypuszcza iskry unoszące się w górę (dusza!), i znika - Zielony pasek pod organizmem pokazuje pozostałe życie (zielony → żółty → czerwony)

12,294 次观看 • 5 个月前