Mehdi Allahyari's banner

Mehdi Allahyari

@MehdiAllahyari • 12,612 subscribers

Entrepreneur | Building AI products to serve at scale. https://t.co/5Rp10wtYhW, https://t.co/hAIZWTfSfL, https://t.co/QhHeAZi9Yz, English account: @MehdiYarix

Shorts

واقعا باورنکردنیه! مدل Kokoro یک مدل پیشرفته‌ی تبدیل متن به گفتار (TTS) با تنها ۸۲ میلیون پارامتره که میتونید با استفاده از transformers .js کامل در مرورگرتون اجرا کنید! 🤯 این مدل تحت لیسانس Apache 2.0 ارائه شده و فعلا از ۱۰ صدای منحصربه‌ فرد انگلیسی پشتیبانی می‌کنه—اون هم بدون نیاز به اتصال به اینترنت! و نکته شگفت‌انگیز اینه که Kokoro فقط با کمتر از ۱۰۰ ساعت داده صوتی آموزش دیده ولی عملکردش واقعا فوق‌العاده‌ است! میتونید حتا صداها را هم با هم ترکیب کنید و صدای جدید درست کنید. سرعتش هم خیلی بالاست روی CPU, و روی GPU انت که توی ۵ ثانیه حدود ۳ دقیقه صدا (speech) تولید میشه. برای تولید محتوا که بینظیره! صدا را گوش بدید تو ویدیو. توی این لینک HuggingFace هم همه صداها هست با لهجه های مختلف. با این چند خط کد میتونید نصب کنید و شروع کنید به استفاده: pip install --upgrade "ai-gradio[kokoro]" import gradio as gr import ai_gradio gr.load(name='kokoro:kokoro-v0_19', src=ai_gradio.registry,).launch()

واقعا باورنکردنیه! مدل Kokoro یک مدل پیشرفته‌ی تبدیل متن به گفتار (TTS) با تنها ۸۲ میلیون پارامتره که میتونید با استفاده از transformers .js کامل در مرورگرتون اجرا کنید! 🤯 این مدل تحت لیسانس Apache 2.0 ارائه شده و فعلا از ۱۰ صدای منحصربه‌ فرد انگلیسی پشتیبانی می‌کنه—اون هم بدون نیاز به اتصال به اینترنت! و نکته شگفت‌انگیز اینه که Kokoro فقط با کمتر از ۱۰۰ ساعت داده صوتی آموزش دیده ولی عملکردش واقعا فوق‌العاده‌ است! میتونید حتا صداها را هم با هم ترکیب کنید و صدای جدید درست کنید. سرعتش هم خیلی بالاست روی CPU, و روی GPU انت که توی ۵ ثانیه حدود ۳ دقیقه صدا (speech) تولید میشه. برای تولید محتوا که بینظیره! صدا را گوش بدید تو ویدیو. توی این لینک HuggingFace هم همه صداها هست با لهجه های مختلف. با این چند خط کد میتونید نصب کنید و شروع کنید به استفاده: pip install --upgrade "ai-gradio[kokoro]" import gradio as gr import ai_gradio gr.load(name='kokoro:kokoro-v0_19', src=ai_gradio.registry,).launch()

45,171 görüntüleme

Videos

Anya Rossi

sweetdream.ai

SweetDream.ai•Sponsored•Livecam

Watch Anya Live

Anya is streaming live right now! Join her private show and enjoy exclusive content.

Exclusive private shows

1.2k viewers online

Private Show

Join now for exclusive access

Free preview available • Premium content

این ریپو خیلی جالبه. یک دیتاست از انواع تمرینهای فیتنس برای عضلات مختلف همراه عکس و ویدیو که به صورت gif هستند. اگه آپ های ورزشی دوست دارید خیلی به درد میخوره. Github:

این ریپو خیلی جالبه. یک دیتاست از انواع تمرینهای فیتنس برای عضلات مختلف همراه عکس و ویدیو که به صورت gif هستند. اگه آپ های ورزشی دوست دارید خیلی به درد میخوره. Github:

Mehdi Allahyari

33,799 görüntüleme • 15 gün önce

دیروز یه توییت دیدم که یکی یه ویدیو گرفته بود از توپ‌های دیجیتال که روی یه دیوار واقعی، از روی برگه‌های چسبی (Post-it) می‌پرن. همه‌چی از کامپیوتر پروجکت شده بود، ولی واقعاً جادویی به نظر می‌رسید. نتونستم از فکرش بیام بیرون. تصمیم گرفتم برای پسرم بسازمش. ایده خیلی ساده‌ست: یه پروژکتور توپ‌هایی رو روی دیوار نشون می‌ده که دارن می‌افتن. کاری که میکنی اینه که روی دیوار Post-it زرد می‌چسبونی. یه دوربین جای این برگه‌ها رو تشخیص می‌ده، و توپ‌ها در لحظه ازشون با فیزیک واقعی bounce می‌شن. تکنولوژی پشتش: -اپن سی وی/ OpenCV برای تشخیص پست‌ایت‌ها با رنگ (HSV thresholding) - وب سوکت/ WebSocket برای فرستادن موقعیت‌ها به مرورگر به‌صورت لحظه‌ای - کتابخونه Matter.js برای شبیه‌سازی فیزیک و یه پنجره مرورگر که فول‌اسکرین روی دیوار پروجکت می‌شه کدش هم توی گیتهاب هست:

دیروز یه توییت دیدم که یکی یه ویدیو گرفته بود از توپ‌های دیجیتال که روی یه دیوار واقعی، از روی برگه‌های چسبی (Post-it) می‌پرن. همه‌چی از کامپیوتر پروجکت شده بود، ولی واقعاً جادویی به نظر می‌رسید. نتونستم از فکرش بیام بیرون. تصمیم گرفتم برای پسرم بسازمش. ایده خیلی ساده‌ست: یه پروژکتور توپ‌هایی رو روی دیوار نشون می‌ده که دارن می‌افتن. کاری که میکنی اینه که روی دیوار Post-it زرد می‌چسبونی. یه دوربین جای این برگه‌ها رو تشخیص می‌ده، و توپ‌ها در لحظه ازشون با فیزیک واقعی bounce می‌شن. تکنولوژی پشتش: -اپن سی وی/ OpenCV برای تشخیص پست‌ایت‌ها با رنگ (HSV thresholding) - وب سوکت/ WebSocket برای فرستادن موقعیت‌ها به مرورگر به‌صورت لحظه‌ای - کتابخونه Matter.js برای شبیه‌سازی فیزیک و یه پنجره مرورگر که فول‌اسکرین روی دیوار پروجکت می‌شه کدش هم توی گیتهاب هست:

Mehdi Allahyari

82,167 görüntüleme • 4 ay önce

بازیِ برنامه‌نویسی داره کلاً عوض میشه و اگر حواستون نباشه، ممکنه جا بمونید! دانشگاه استنفورد یه دوره جدید راه انداخته به اسم «The Modern Software Developer» که حرف حسابش اینه: دورانِ صرفاً «کد زدن» با دست داره تموم میشه. الان دیگه شما باید یاد بگیرید چطوری با AI Agentها کار کنید، چطوری از ابزارهایی مثل Cursor و Warp استفاده کنید و در واقع به جای کدنویس، «معمار» و «مدیر» هوش مصنوعی باشید. تو این دوره دقیقاً دارن یاد میدن که چطور فرایند توسعه نرم‌افزار داره از «تایپ کردن سینتکس» به «تعامل با AI» برای ساخت سیستم‌های پیچیده تغییر می‌کنه. خلاصه اینکه آینده‌ی شغلی شما دیگه فقط به دونستن الگوریتم نیست، به اینه که چقدر خوب می‌تونید از این ابزارهای جدید کار بکشید. تمام مطالب اعم از اسلایدها و پروژه ها را هم گذاشتند. پیشنهاد می‌کنم حتماً یه سر به سرفصل‌هاش بزنید تا ببینید دنیا دست کیه:

بازیِ برنامه‌نویسی داره کلاً عوض میشه و اگر حواستون نباشه، ممکنه جا بمونید! دانشگاه استنفورد یه دوره جدید راه انداخته به اسم «The Modern Software Developer» که حرف حسابش اینه: دورانِ صرفاً «کد زدن» با دست داره تموم میشه. الان دیگه شما باید یاد بگیرید چطوری با AI Agentها کار کنید، چطوری از ابزارهایی مثل Cursor و Warp استفاده کنید و در واقع به جای کدنویس، «معمار» و «مدیر» هوش مصنوعی باشید. تو این دوره دقیقاً دارن یاد میدن که چطور فرایند توسعه نرم‌افزار داره از «تایپ کردن سینتکس» به «تعامل با AI» برای ساخت سیستم‌های پیچیده تغییر می‌کنه. خلاصه اینکه آینده‌ی شغلی شما دیگه فقط به دونستن الگوریتم نیست، به اینه که چقدر خوب می‌تونید از این ابزارهای جدید کار بکشید. تمام مطالب اعم از اسلایدها و پروژه ها را هم گذاشتند. پیشنهاد می‌کنم حتماً یه سر به سرفصل‌هاش بزنید تا ببینید دنیا دست کیه:

Mehdi Allahyari

125,331 görüntüleme • 7 ay önce

اکستنشن ترجمه همزبان ویدیو که روش کار میکردم امروز توی web store قرار گرفت. باهاش میتونید هر ویدیویی که توی browser پخش میشه چه لوکال باشه چه توی youtube به ۱۰ زبان به صورت realtime ترجمه کنید از جمله فارسی. (فقط از فارسی به زبانهای دیگه الان نیست.) امتحانش کنید و بهم فیدبک بدید. ممنون میشم. لینک: Chrome extension: Website:

اکستنشن ترجمه همزبان ویدیو که روش کار میکردم امروز توی web store قرار گرفت. باهاش میتونید هر ویدیویی که توی browser پخش میشه چه لوکال باشه چه توی youtube به ۱۰ زبان به صورت realtime ترجمه کنید از جمله فارسی. (فقط از فارسی به زبانهای دیگه الان نیست.) امتحانش کنید و بهم فیدبک بدید. ممنون میشم. لینک: Chrome extension: Website:

Mehdi Allahyari

44,073 görüntüleme • 2 ay önce

این ریپو به نظرم یکی از کاملترین هاست برای یادگیری AI Engineering. یک سرفصل کامل تشکیل شده از ۲۰ مرحله با مباحث خیلی کاربردی و درقالب چندین زبان از جمله Python, TypeScript, Rust, Julia. با توجه به سطح مهارتتون از ۶۰ ساعت تا بیشتر از ۳۰۰ ساعت زمان میخاد. Github:

این ریپو به نظرم یکی از کاملترین هاست برای یادگیری AI Engineering. یک سرفصل کامل تشکیل شده از ۲۰ مرحله با مباحث خیلی کاربردی و درقالب چندین زبان از جمله Python, TypeScript, Rust, Julia. با توجه به سطح مهارتتون از ۶۰ ساعت تا بیشتر از ۳۰۰ ساعت زمان میخاد. Github:

Mehdi Allahyari

36,236 görüntüleme • 2 ay önce

یک اپ دیگه درست کردم که زیرنویس و ترجمه هم‌زمان (realtime) هر ویدیویی را توی browser بخصوص توی یوتیوب نشون میده. برای ۱۰ زبان مختلف. چند روز پیش یک ورژن دیگه ساخته بودم که گوشی را تبدیل میکنه به یه دستگاه زیرنویس زنده. این یکی از به chrome extension تبدیلش کردم با امکانات بیشتر. این دمو را میتونید با صدا گوش کنید. لینک ورژن قبلی: Github:

یک اپ دیگه درست کردم که زیرنویس و ترجمه هم‌زمان (realtime) هر ویدیویی را توی browser بخصوص توی یوتیوب نشون میده. برای ۱۰ زبان مختلف. چند روز پیش یک ورژن دیگه ساخته بودم که گوشی را تبدیل میکنه به یه دستگاه زیرنویس زنده. این یکی از به chrome extension تبدیلش کردم با امکانات بیشتر. این دمو را میتونید با صدا گوش کنید. لینک ورژن قبلی: Github:

Mehdi Allahyari

34,242 görüntüleme • 3 ay önce

الان داشتن رزومه شخصی سازی شده برای هر شغل خیلی ضروریه! اگر می‌خواهید رزومه‌ای داشته باشید که هم ساختار مهندسی داشته باشد و هم چشم‌نواز باشد، حتما به ریپوزیتوری RenderCV سر بزنید. این ابزار سرعت و دقت کارتان را چند پله بالاتر می‌برد. راحت میتونید رزومه‌تان را مثل یک حرفه‌ای مدیریت کنید و از شر دردسرهای ورد (Word) و به‌هم‌ریختگی‌های چیدمان خلاص بشید. ایده اصلی اینه: محتوا رو از ظاهر جدا کن. دیگه لازم نیست نگران باشی که اگه یه خط به سوابق کاریت اضافه کنی، کل فونت‌ها و فاصله‌های رزومه‌ات به هم می‌ریزه. تو فقط متنت رو توی فایل YAML می‌نویسی، RenderCV خودش بقیه‌ی کارها (چیدمان، فاصله‌گذاری، فونت و...) رو انجام میده. چه ویژگی هایی داره؟ - مدیریت ورژن‌کنترل: می‌توانید رزومه‌تان را در گیت‌هاب قرار دهید و تمام تغییرات آن را در طول زمان ردیابی کنید. - ظاهر بی‌نقص: دیگر نیازی نیست ساعت‌ها وقت صرف تنظیم فاصله‌ها و فونت‌ها کنید؛ همه‌چیز طبق استانداردهای حرفه‌ای چیده می‌شود. - خروجی‌های متنوع: علاوه بر نسخه PDF، به شما فایل‌های Markdown و LaTeX هم می‌دهد که برای پلتفرم‌های مختلف عالی است. - تمرکز روی محتوا: شما فقط روی نوشتن تجربیاتتان تمرکز می‌کنید و اجازه می‌دهید ابزار، کارِ طراحی را برایتان انجام دهد. Github:

الان داشتن رزومه شخصی سازی شده برای هر شغل خیلی ضروریه! اگر می‌خواهید رزومه‌ای داشته باشید که هم ساختار مهندسی داشته باشد و هم چشم‌نواز باشد، حتما به ریپوزیتوری RenderCV سر بزنید. این ابزار سرعت و دقت کارتان را چند پله بالاتر می‌برد. راحت میتونید رزومه‌تان را مثل یک حرفه‌ای مدیریت کنید و از شر دردسرهای ورد (Word) و به‌هم‌ریختگی‌های چیدمان خلاص بشید. ایده اصلی اینه: محتوا رو از ظاهر جدا کن. دیگه لازم نیست نگران باشی که اگه یه خط به سوابق کاریت اضافه کنی، کل فونت‌ها و فاصله‌های رزومه‌ات به هم می‌ریزه. تو فقط متنت رو توی فایل YAML می‌نویسی، RenderCV خودش بقیه‌ی کارها (چیدمان، فاصله‌گذاری، فونت و...) رو انجام میده. چه ویژگی هایی داره؟ - مدیریت ورژن‌کنترل: می‌توانید رزومه‌تان را در گیت‌هاب قرار دهید و تمام تغییرات آن را در طول زمان ردیابی کنید. - ظاهر بی‌نقص: دیگر نیازی نیست ساعت‌ها وقت صرف تنظیم فاصله‌ها و فونت‌ها کنید؛ همه‌چیز طبق استانداردهای حرفه‌ای چیده می‌شود. - خروجی‌های متنوع: علاوه بر نسخه PDF، به شما فایل‌های Markdown و LaTeX هم می‌دهد که برای پلتفرم‌های مختلف عالی است. - تمرکز روی محتوا: شما فقط روی نوشتن تجربیاتتان تمرکز می‌کنید و اجازه می‌دهید ابزار، کارِ طراحی را برایتان انجام دهد. Github:

Mehdi Allahyari

54,111 görüntüleme • 7 ay önce

یک اپ دیگه ساختم که گوشی را تبدیل میکنه به یه دستگاه زیرنویس زنده. یه دمو از real time transcription ساختم که متن صحبت‌ها رو کلمه‌به‌کلمه به‌صورت overlay روی تصویر دوربین گوشی نشون می‌ده. چطور کار می‌کنه: → لپ‌تاپ صدا رو می‌گیره (از میکروفون یا حتی صدای سیستم، مثلا هر ویدیویی که پخش می‌شه) → Deepgram Nova-3 حدود ۳۰۰ میلی‌ثانیه‌ای تبدیلش می‌کنه به متن → کلمه‌ها یکی‌یکی با یه افکت glow روی صفحه گوشی ظاهر می‌شن نه اپ لازم داره، نه سخت‌افزار خاص. فقط یه مرورگر روی گوشی و پایتون روی لپ‌تاپ. چندتا use case باحال که به ذهنم رسید: زیرنویس زنده برای یوتیوب، پادکست یا ویدیوکال‌ها کمک به افراد ناشنوا یا کم‌شنوا تو مکالمه‌های حضوری جایگزین کردن transcription با ترجمه → زیرنویس AR زنده به هر زبانی مثل ترجمه همزمان که تو تلویزیون انجام میشه. کد: Github:

یک اپ دیگه ساختم که گوشی را تبدیل میکنه به یه دستگاه زیرنویس زنده. یه دمو از real time transcription ساختم که متن صحبت‌ها رو کلمه‌به‌کلمه به‌صورت overlay روی تصویر دوربین گوشی نشون می‌ده. چطور کار می‌کنه: → لپ‌تاپ صدا رو می‌گیره (از میکروفون یا حتی صدای سیستم، مثلا هر ویدیویی که پخش می‌شه) → Deepgram Nova-3 حدود ۳۰۰ میلی‌ثانیه‌ای تبدیلش می‌کنه به متن → کلمه‌ها یکی‌یکی با یه افکت glow روی صفحه گوشی ظاهر می‌شن نه اپ لازم داره، نه سخت‌افزار خاص. فقط یه مرورگر روی گوشی و پایتون روی لپ‌تاپ. چندتا use case باحال که به ذهنم رسید: زیرنویس زنده برای یوتیوب، پادکست یا ویدیوکال‌ها کمک به افراد ناشنوا یا کم‌شنوا تو مکالمه‌های حضوری جایگزین کردن transcription با ترجمه → زیرنویس AR زنده به هر زبانی مثل ترجمه همزمان که تو تلویزیون انجام میشه. کد: Github:

Mehdi Allahyari

30,126 görüntüleme • 3 ay önce

کمپانی OpenAI اومده و یک مجموعه ارزشمند پرامپت برای نقش ها/role های مختلف آماده کرده (به صورت template) که فقط کافیه کپی کنید و بسته به نیازتون تغییر بدید. این پرامپت ها با اینکه برای مدلهای openai ساخته شدند ولی روی مدلهای دیگه مثل gemini و anthropic هم خیلی عالی کار میکنند. استفاده کنید و لذتش را ببرید.

کمپانی OpenAI اومده و یک مجموعه ارزشمند پرامپت برای نقش ها/role های مختلف آماده کرده (به صورت template) که فقط کافیه کپی کنید و بسته به نیازتون تغییر بدید. این پرامپت ها با اینکه برای مدلهای openai ساخته شدند ولی روی مدلهای دیگه مثل gemini و anthropic هم خیلی عالی کار میکنند. استفاده کنید و لذتش را ببرید.

Mehdi Allahyari

58,254 görüntüleme • 10 ay önce

این کورس/دوره عالی راجع به Advanced Large Language Model Agents از دانشگاه برکلی را قبلا معرفی کرده بودم. الان دیگه کامل همه مطالب از جمله اسلایدها و ویدیوها را گذاشتند. موضوعات داغ و مهم راجع به LLM ها و ایجنتها را شامل میشه. Link:

این کورس/دوره عالی راجع به Advanced Large Language Model Agents از دانشگاه برکلی را قبلا معرفی کرده بودم. الان دیگه کامل همه مطالب از جمله اسلایدها و ویدیوها را گذاشتند. موضوعات داغ و مهم راجع به LLM ها و ایجنتها را شامل میشه. Link:

Mehdi Allahyari

41,181 görüntüleme • 7 ay önce

این ابزار را نصب کنید. برای تبدیل صدا به متن فوق الاده هست. و کاملا هم لوکال هست. ویدیوی زیر را با صدا ببینید. فارسی هم دقتش خیلی خوبه. Link:

این ابزار را نصب کنید. برای تبدیل صدا به متن فوق الاده هست. و کاملا هم لوکال هست. ویدیوی زیر را با صدا ببینید. فارسی هم دقتش خیلی خوبه. Link:

Mehdi Allahyari

51,804 görüntüleme • 10 ay önce

گوگل یه دوره آنلاین ۵ روزه از ۱۱ تا ۱۵ نوامبر داره که میتونه کمکتون کنه تا تکنولوژی‌ها و روش‌های پایه Gen AI رو خوب یاد بگیرید. این دوره رو تیم تحقیق و مهندسی ML گوگل طراحی کرده. هم مباحث نظری داره و هم تمرین‌های عملی کدنویسی، تا بتونید پروژه‌های جدید Gen AI رو شروع کنید. مباحث این ۵ روز: Day 1: Foundational Models & Prompt Engineering Day 2: Embeddings and Vector Stores/Databases Day 3: Generative AI Agents Day 4: Domain-Specific LLMs Day 5: MLOps for Generative AI Link:

گوگل یه دوره آنلاین ۵ روزه از ۱۱ تا ۱۵ نوامبر داره که میتونه کمکتون کنه تا تکنولوژی‌ها و روش‌های پایه Gen AI رو خوب یاد بگیرید. این دوره رو تیم تحقیق و مهندسی ML گوگل طراحی کرده. هم مباحث نظری داره و هم تمرین‌های عملی کدنویسی، تا بتونید پروژه‌های جدید Gen AI رو شروع کنید. مباحث این ۵ روز: Day 1: Foundational Models & Prompt Engineering Day 2: Embeddings and Vector Stores/Databases Day 3: Generative AI Agents Day 4: Domain-Specific LLMs Day 5: MLOps for Generative AI Link:

Mehdi Allahyari

86,189 görüntüleme • 1 yıl önce

یکی از پر تقاضا ترین مهارت ها deploy کردن مدلهای ماشین لرنینگ توی production هست. حالا دانشگاه carnegie mellon که شاید بالاترین رنک را در ماشین لرنینگ داشته باشه، یک کورس داره ارائه میده راجع به همین موضوع. این دوره نحوه ساخت، استقرار، اطمینان و نگهداری (build, deploy, assure, and maintain) از محصولات نرم‌افزاری با مدل‌های ماشین لرنینگ را پوشش می‌دهد. این دوره شامل کل چرخه عمر از یک مدل اولیه ماشین لرنینگ تا یک سیستم کامل مستقر در محیط تولید است. تمام مطالب آموزشی شامل کد، اسلاید و مقاله ها کاملا در دسترس هست. قدم به قدم با همین کورس برید جلو و آخر دوره مهارتی کسب خواهید کرد که میتونه برای پیدا کردن شغل بعدی بهتون کمک کنه.

یکی از پر تقاضا ترین مهارت ها deploy کردن مدلهای ماشین لرنینگ توی production هست. حالا دانشگاه carnegie mellon که شاید بالاترین رنک را در ماشین لرنینگ داشته باشه، یک کورس داره ارائه میده راجع به همین موضوع. این دوره نحوه ساخت، استقرار، اطمینان و نگهداری (build, deploy, assure, and maintain) از محصولات نرم‌افزاری با مدل‌های ماشین لرنینگ را پوشش می‌دهد. این دوره شامل کل چرخه عمر از یک مدل اولیه ماشین لرنینگ تا یک سیستم کامل مستقر در محیط تولید است. تمام مطالب آموزشی شامل کد، اسلاید و مقاله ها کاملا در دسترس هست. قدم به قدم با همین کورس برید جلو و آخر دوره مهارتی کسب خواهید کرد که میتونه برای پیدا کردن شغل بعدی بهتون کمک کنه.

Mehdi Allahyari

65,776 görüntüleme • 1 yıl önce

یک ریپو جالب و به درد بخور! اسمش free-claude-code. که بهتون این امکان رو می‌ده که CLI رسمی Claude Code رو به هر مدلی وصل کنید چه NIM، چه DeepSeek، یا حتی مدل‌های لوکال از طریق LM Studio. چطور کار می‌کنه: با استفاده از این پراکسی، می‌تونید همچنان از Claude Code CLI یا افزونه VSCode به‌عنوان اینترفیس استفاده کنید، ولی به‌جای اینکه درخواست‌ها برن سمت سرورهای Anthropic، رهگیری می‌شن و به سرویس دلخواهتون (مثل NVIDIA NIM، OpenRouter، DeepSeek یا یه مدل لوکال روی سیستم خودتون) ریدایرکت می‌شن. میتونید کلی مدل را به صورت رایگان استفاده کنید. Github:

یک ریپو جالب و به درد بخور! اسمش free-claude-code. که بهتون این امکان رو می‌ده که CLI رسمی Claude Code رو به هر مدلی وصل کنید چه NIM، چه DeepSeek، یا حتی مدل‌های لوکال از طریق LM Studio. چطور کار می‌کنه: با استفاده از این پراکسی، می‌تونید همچنان از Claude Code CLI یا افزونه VSCode به‌عنوان اینترفیس استفاده کنید، ولی به‌جای اینکه درخواست‌ها برن سمت سرورهای Anthropic، رهگیری می‌شن و به سرویس دلخواهتون (مثل NVIDIA NIM، OpenRouter، DeepSeek یا یه مدل لوکال روی سیستم خودتون) ریدایرکت می‌شن. میتونید کلی مدل را به صورت رایگان استفاده کنید. Github:

Mehdi Allahyari

16,966 görüntüleme • 3 ay önce

کمپانی openAI یک آکادمی راه انداخته برای آموزش مهارتهای مربوط به استفاده از AI. کلی ویدیوی کوتاه و مطالب آموزشی داره و به نظر میرسه قراره کلی بهش اضافه بشه. آدرسش:

کمپانی openAI یک آکادمی راه انداخته برای آموزش مهارتهای مربوط به استفاده از AI. کلی ویدیوی کوتاه و مطالب آموزشی داره و به نظر میرسه قراره کلی بهش اضافه بشه. آدرسش:

Mehdi Allahyari

52,695 görüntüleme • 1 yıl önce

این مدل جدید خیلی کوچک و سبک که گوگل معرفی کرد به اسم FunctionGemma را دست کم نگیرید. یه مدل فوق‌العاده سبک (فقط ۲۷۰ میلیون پارامتر!) دارید که انقدر کوچیکه که روی گوشی‌های معمولی هم راحت اجرا میشه، اما تخصصش فقط یک چیزه: تبدیل حرف‌های ما به دستورات برنامه‌نویسی (Function Calling). میتونید به صورت کاملا رایگان fine tune ش کنید برای کارهای مختلف. اما این مدل به چه دردی می‌خوره؟ بیاین چندتا مورد جذاب رو بررسی کنیم: ۱. دستیار شخصی کاملاً آفلاین و امن: تا حالا شده بخواین با فرمان صوتی چراغ خونه رو خاموش کنید یا یه تایمر بذارید، ولی چون اینترنت قطع بوده کار نکرده؟ با FunctionGemma، اپلیکیشن‌ها می‌تونن بدون نیاز به سرور و کاملاً روی خود گوشی، حرف شما رو بفهمن و دقیقاً دکمه یا تابع مربوطه رو اجرا کنن. امنیتش هم عالیه چون هیچ داده‌ای از گوشی خارج نمیشه. ۲. بازی‌های تعاملی نسل جدید: تصور کنید توی یه بازی نقش‌آفرینی (RPG)، به جای اینکه فقط از بین گزینه‌ها انتخاب کنید، به کاراکتر بگید: «برو از توی صندوقچه اون معجون قرمز رو بردار و بده به سرباز کناری.» این مدل می‌تونه این جمله رو به کدهای بازی ترجمه کنه و اکشن‌ها رو بلافاصله انجام بده. ۳. اتوماسیون کارهای سیستم: توسعه‌دهنده‌ها می‌تونن ابزارهایی بسازن که کارهای تکراری سیستم‌عامل رو برامون انجام بده. مثلاً بگید: «فایل‌های PDF توی پوشه دانلود رو که حجمشون بالای ۱۰ مگه زیپ کن و بفرست به ایمیل علی.» مدل دقیقاً توابع مربوط به مدیریت فایل و ایمیل رو فراخوانی می‌کنه. ۴. اینترنت اشیاء (IoT) هوشمندتر: توی گجت‌های هوشمند که رم و پردازنده خیلی محدودی دارن، FunctionGemma مثل یک جادوگر عمل می‌کنه. چون فقط به ۵۵۰ مگابایت رم نیاز داره، می‌تونه مستقیم روی سخت‌افزار لوازم خانگی یا ابزارهای صنعتی نصب بشه تا دستورات پیچیده انسانی رو به زبان ماشین ترجمه کنه. برای fine tune کردنش این بلاگ کامل توضیح میده به همراه کد. Blog:

این مدل جدید خیلی کوچک و سبک که گوگل معرفی کرد به اسم FunctionGemma را دست کم نگیرید. یه مدل فوق‌العاده سبک (فقط ۲۷۰ میلیون پارامتر!) دارید که انقدر کوچیکه که روی گوشی‌های معمولی هم راحت اجرا میشه، اما تخصصش فقط یک چیزه: تبدیل حرف‌های ما به دستورات برنامه‌نویسی (Function Calling). میتونید به صورت کاملا رایگان fine tune ش کنید برای کارهای مختلف. اما این مدل به چه دردی می‌خوره؟ بیاین چندتا مورد جذاب رو بررسی کنیم: ۱. دستیار شخصی کاملاً آفلاین و امن: تا حالا شده بخواین با فرمان صوتی چراغ خونه رو خاموش کنید یا یه تایمر بذارید، ولی چون اینترنت قطع بوده کار نکرده؟ با FunctionGemma، اپلیکیشن‌ها می‌تونن بدون نیاز به سرور و کاملاً روی خود گوشی، حرف شما رو بفهمن و دقیقاً دکمه یا تابع مربوطه رو اجرا کنن. امنیتش هم عالیه چون هیچ داده‌ای از گوشی خارج نمیشه. ۲. بازی‌های تعاملی نسل جدید: تصور کنید توی یه بازی نقش‌آفرینی (RPG)، به جای اینکه فقط از بین گزینه‌ها انتخاب کنید، به کاراکتر بگید: «برو از توی صندوقچه اون معجون قرمز رو بردار و بده به سرباز کناری.» این مدل می‌تونه این جمله رو به کدهای بازی ترجمه کنه و اکشن‌ها رو بلافاصله انجام بده. ۳. اتوماسیون کارهای سیستم: توسعه‌دهنده‌ها می‌تونن ابزارهایی بسازن که کارهای تکراری سیستم‌عامل رو برامون انجام بده. مثلاً بگید: «فایل‌های PDF توی پوشه دانلود رو که حجمشون بالای ۱۰ مگه زیپ کن و بفرست به ایمیل علی.» مدل دقیقاً توابع مربوط به مدیریت فایل و ایمیل رو فراخوانی می‌کنه. ۴. اینترنت اشیاء (IoT) هوشمندتر: توی گجت‌های هوشمند که رم و پردازنده خیلی محدودی دارن، FunctionGemma مثل یک جادوگر عمل می‌کنه. چون فقط به ۵۵۰ مگابایت رم نیاز داره، می‌تونه مستقیم روی سخت‌افزار لوازم خانگی یا ابزارهای صنعتی نصب بشه تا دستورات پیچیده انسانی رو به زبان ماشین ترجمه کنه. برای fine tune کردنش این بلاگ کامل توضیح میده به همراه کد. Blog:

Mehdi Allahyari

27,012 görüntüleme • 7 ay önce

یک مدل جدید اومده برای پارس کردن داکیومنت و OCR.حدود ۱۰۰ زبان از جمله فارسی را هم پشتیبانی میکنه. من برای یک عکس یک مقاله امتحان کردم که نتیجه خیلی عالی بود. مدل با اینکه 1.7B پارامتر داره ولی نتایج خیلی خوبند. دمو در ویدیو زیر: Github:

یک مدل جدید اومده برای پارس کردن داکیومنت و OCR.حدود ۱۰۰ زبان از جمله فارسی را هم پشتیبانی میکنه. من برای یک عکس یک مقاله امتحان کردم که نتیجه خیلی عالی بود. مدل با اینکه 1.7B پارامتر داره ولی نتایج خیلی خوبند. دمو در ویدیو زیر: Github:

Mehdi Allahyari

38,442 görüntüleme • 11 ay önce

گوگل دوباره داره برای دوره ۵ روزه AI Agents ثبت نام میکنه که از ۱۰ نوامبر شروع میشه. دوره قبلیش لینکش تو همین وب سایت هست که میتونید برید و همه مطالبش را استفاده کنید. ولی دوره جدید موضوعاتش خیلی خیلی جالبند. حتما ثبت نام کنید. Link:

گوگل دوباره داره برای دوره ۵ روزه AI Agents ثبت نام میکنه که از ۱۰ نوامبر شروع میشه. دوره قبلیش لینکش تو همین وب سایت هست که میتونید برید و همه مطالبش را استفاده کنید. ولی دوره جدید موضوعاتش خیلی خیلی جالبند. حتما ثبت نام کنید. Link:

Mehdi Allahyari

32,510 görüntüleme • 9 ay önce