
Mehdi Allahyari
@MehdiAllahyari • 12,434 subscribers
Entrepreneur | Building AI products to serve at scale. https://t.co/5Rp10wtYhW, https://t.co/hAIZWTfSfL, https://t.co/QhHeAZi9Yz, English account: @MehdiYarix
Shorts
Videos

این ریپو به نظرم یکی از کاملترین هاست برای یادگیری AI Engineering. یک سرفصل کامل تشکیل شده از ۲۰ مرحله با مباحث خیلی کاربردی و درقالب چندین زبان از جمله Python, TypeScript, Rust, Julia. با توجه به سطح مهارتتون از ۶۰ ساعت تا بیشتر از ۳۰۰ ساعت زمان میخاد. Github:
Mehdi Allahyari35,179 görüntüleme • 21 gün önce

اکستنشن ترجمه همزبان ویدیو که روش کار میکردم امروز توی web store قرار گرفت. باهاش میتونید هر ویدیویی که توی browser پخش میشه چه لوکال باشه چه توی youtube به ۱۰ زبان به صورت realtime ترجمه کنید از جمله فارسی. (فقط از فارسی به زبانهای دیگه الان نیست.) امتحانش کنید و بهم فیدبک بدید. ممنون میشم. لینک: Chrome extension: Website:
Mehdi Allahyari41,048 görüntüleme • 27 gün önce

دیروز یه توییت دیدم که یکی یه ویدیو گرفته بود از توپهای دیجیتال که روی یه دیوار واقعی، از روی برگههای چسبی (Post-it) میپرن. همهچی از کامپیوتر پروجکت شده بود، ولی واقعاً جادویی به نظر میرسید. نتونستم از فکرش بیام بیرون. تصمیم گرفتم برای پسرم بسازمش. ایده خیلی سادهست: یه پروژکتور توپهایی رو روی دیوار نشون میده که دارن میافتن. کاری که میکنی اینه که روی دیوار Post-it زرد میچسبونی. یه دوربین جای این برگهها رو تشخیص میده، و توپها در لحظه ازشون با فیزیک واقعی bounce میشن. تکنولوژی پشتش: -اپن سی وی/ OpenCV برای تشخیص پستایتها با رنگ (HSV thresholding) - وب سوکت/ WebSocket برای فرستادن موقعیتها به مرورگر بهصورت لحظهای - کتابخونه Matter.js برای شبیهسازی فیزیک و یه پنجره مرورگر که فولاسکرین روی دیوار پروجکت میشه کدش هم توی گیتهاب هست:
Mehdi Allahyari81,915 görüntüleme • 2 ay önce

بازیِ برنامهنویسی داره کلاً عوض میشه و اگر حواستون نباشه، ممکنه جا بمونید! دانشگاه استنفورد یه دوره جدید راه انداخته به اسم «The Modern Software Developer» که حرف حسابش اینه: دورانِ صرفاً «کد زدن» با دست داره تموم میشه. الان دیگه شما باید یاد بگیرید چطوری با AI Agentها کار کنید، چطوری از ابزارهایی مثل Cursor و Warp استفاده کنید و در واقع به جای کدنویس، «معمار» و «مدیر» هوش مصنوعی باشید. تو این دوره دقیقاً دارن یاد میدن که چطور فرایند توسعه نرمافزار داره از «تایپ کردن سینتکس» به «تعامل با AI» برای ساخت سیستمهای پیچیده تغییر میکنه. خلاصه اینکه آیندهی شغلی شما دیگه فقط به دونستن الگوریتم نیست، به اینه که چقدر خوب میتونید از این ابزارهای جدید کار بکشید. تمام مطالب اعم از اسلایدها و پروژه ها را هم گذاشتند. پیشنهاد میکنم حتماً یه سر به سرفصلهاش بزنید تا ببینید دنیا دست کیه:
Mehdi Allahyari124,646 görüntüleme • 6 ay önce

یک اپ دیگه درست کردم که زیرنویس و ترجمه همزمان (realtime) هر ویدیویی را توی browser بخصوص توی یوتیوب نشون میده. برای ۱۰ زبان مختلف. چند روز پیش یک ورژن دیگه ساخته بودم که گوشی را تبدیل میکنه به یه دستگاه زیرنویس زنده. این یکی از به chrome extension تبدیلش کردم با امکانات بیشتر. این دمو را میتونید با صدا گوش کنید. لینک ورژن قبلی: Github:
Mehdi Allahyari34,242 görüntüleme • 2 ay önce

یک اپ دیگه ساختم که گوشی را تبدیل میکنه به یه دستگاه زیرنویس زنده. یه دمو از real time transcription ساختم که متن صحبتها رو کلمهبهکلمه بهصورت overlay روی تصویر دوربین گوشی نشون میده. چطور کار میکنه: → لپتاپ صدا رو میگیره (از میکروفون یا حتی صدای سیستم، مثلا هر ویدیویی که پخش میشه) → Deepgram Nova-3 حدود ۳۰۰ میلیثانیهای تبدیلش میکنه به متن → کلمهها یکییکی با یه افکت glow روی صفحه گوشی ظاهر میشن نه اپ لازم داره، نه سختافزار خاص. فقط یه مرورگر روی گوشی و پایتون روی لپتاپ. چندتا use case باحال که به ذهنم رسید: زیرنویس زنده برای یوتیوب، پادکست یا ویدیوکالها کمک به افراد ناشنوا یا کمشنوا تو مکالمههای حضوری جایگزین کردن transcription با ترجمه → زیرنویس AR زنده به هر زبانی مثل ترجمه همزمان که تو تلویزیون انجام میشه. کد: Github:
Mehdi Allahyari29,995 görüntüleme • 2 ay önce

الان داشتن رزومه شخصی سازی شده برای هر شغل خیلی ضروریه! اگر میخواهید رزومهای داشته باشید که هم ساختار مهندسی داشته باشد و هم چشمنواز باشد، حتما به ریپوزیتوری RenderCV سر بزنید. این ابزار سرعت و دقت کارتان را چند پله بالاتر میبرد. راحت میتونید رزومهتان را مثل یک حرفهای مدیریت کنید و از شر دردسرهای ورد (Word) و بههمریختگیهای چیدمان خلاص بشید. ایده اصلی اینه: محتوا رو از ظاهر جدا کن. دیگه لازم نیست نگران باشی که اگه یه خط به سوابق کاریت اضافه کنی، کل فونتها و فاصلههای رزومهات به هم میریزه. تو فقط متنت رو توی فایل YAML مینویسی، RenderCV خودش بقیهی کارها (چیدمان، فاصلهگذاری، فونت و...) رو انجام میده. چه ویژگی هایی داره؟ - مدیریت ورژنکنترل: میتوانید رزومهتان را در گیتهاب قرار دهید و تمام تغییرات آن را در طول زمان ردیابی کنید. - ظاهر بینقص: دیگر نیازی نیست ساعتها وقت صرف تنظیم فاصلهها و فونتها کنید؛ همهچیز طبق استانداردهای حرفهای چیده میشود. - خروجیهای متنوع: علاوه بر نسخه PDF، به شما فایلهای Markdown و LaTeX هم میدهد که برای پلتفرمهای مختلف عالی است. - تمرکز روی محتوا: شما فقط روی نوشتن تجربیاتتان تمرکز میکنید و اجازه میدهید ابزار، کارِ طراحی را برایتان انجام دهد. Github:
Mehdi Allahyari54,111 görüntüleme • 5 ay önce

یک ریپو جالب و به درد بخور! اسمش free-claude-code. که بهتون این امکان رو میده که CLI رسمی Claude Code رو به هر مدلی وصل کنید چه NIM، چه DeepSeek، یا حتی مدلهای لوکال از طریق LM Studio. چطور کار میکنه: با استفاده از این پراکسی، میتونید همچنان از Claude Code CLI یا افزونه VSCode بهعنوان اینترفیس استفاده کنید، ولی بهجای اینکه درخواستها برن سمت سرورهای Anthropic، رهگیری میشن و به سرویس دلخواهتون (مثل NVIDIA NIM، OpenRouter، DeepSeek یا یه مدل لوکال روی سیستم خودتون) ریدایرکت میشن. میتونید کلی مدل را به صورت رایگان استفاده کنید. Github:
Mehdi Allahyari16,966 görüntüleme • 1 ay önce

کمپانی OpenAI اومده و یک مجموعه ارزشمند پرامپت برای نقش ها/role های مختلف آماده کرده (به صورت template) که فقط کافیه کپی کنید و بسته به نیازتون تغییر بدید. این پرامپت ها با اینکه برای مدلهای openai ساخته شدند ولی روی مدلهای دیگه مثل gemini و anthropic هم خیلی عالی کار میکنند. استفاده کنید و لذتش را ببرید.
Mehdi Allahyari57,981 görüntüleme • 8 ay önce

گوگل یه دوره آنلاین ۵ روزه از ۱۱ تا ۱۵ نوامبر داره که میتونه کمکتون کنه تا تکنولوژیها و روشهای پایه Gen AI رو خوب یاد بگیرید. این دوره رو تیم تحقیق و مهندسی ML گوگل طراحی کرده. هم مباحث نظری داره و هم تمرینهای عملی کدنویسی، تا بتونید پروژههای جدید Gen AI رو شروع کنید. مباحث این ۵ روز: Day 1: Foundational Models & Prompt Engineering Day 2: Embeddings and Vector Stores/Databases Day 3: Generative AI Agents Day 4: Domain-Specific LLMs Day 5: MLOps for Generative AI Link:
Mehdi Allahyari86,127 görüntüleme • 1 yıl önce

یکی از پر تقاضا ترین مهارت ها deploy کردن مدلهای ماشین لرنینگ توی production هست. حالا دانشگاه carnegie mellon که شاید بالاترین رنک را در ماشین لرنینگ داشته باشه، یک کورس داره ارائه میده راجع به همین موضوع. این دوره نحوه ساخت، استقرار، اطمینان و نگهداری (build, deploy, assure, and maintain) از محصولات نرمافزاری با مدلهای ماشین لرنینگ را پوشش میدهد. این دوره شامل کل چرخه عمر از یک مدل اولیه ماشین لرنینگ تا یک سیستم کامل مستقر در محیط تولید است. تمام مطالب آموزشی شامل کد، اسلاید و مقاله ها کاملا در دسترس هست. قدم به قدم با همین کورس برید جلو و آخر دوره مهارتی کسب خواهید کرد که میتونه برای پیدا کردن شغل بعدی بهتون کمک کنه.
Mehdi Allahyari63,750 görüntüleme • 1 yıl önce

خیلی راحت میتونید مدلهای جدید deepseek را دانلود و امتحان کنید. و خودتون ببینید که چقدر به کارتون میاد. توی ویدیوی زیر نشون دادم. من ۳ تا از مدلهای deepseek از جمله دوتا ورژن ۱.۵ میلیارد پارامتری و مدل ۷میلیاردی را امتحان کردم. چند تا سوال که بیشتر coding بودن پرسیدم و همگی خیلی بد جواب دادند. البته مدل ۷b خیلی بهتر بود ولی کد بازهم غلط بود. بعد همین سوالها را از Qwen ۱.۵ میلیاردی پرسیدم و عالی جواب داد. البته که چندتا سوال خیلی ارزیابی کاملی نیست ولی بازهم انتظارم خیلی بیشتر از اینها بود. میخام بگم که درسته که این مدلهای deepseek خیلی سروصدا کرده ولی مدلهای کوچک که ازش distill شدن خیلی خوب کار نمیکنن بخصوص تو coding. اون مدلهای بزرگترش البته خیلی خوبند. نتیجه اخلاقی: خیلی به hype توجه نکنید. هر مدلی هم برای همه جور کاری خوب نیست. این مدلهای reasoning بدرد سوالهای ریاضی و اینجور مباحث میخورن. مثلا برای کدینگ خیلی مدلهای کوچکتر ولی به مراتب بهتر هست. پس خودتون را وابسته به یک مدل خاص نکنید.
Mehdi Allahyari63,786 görüntüleme • 1 yıl önce

این مدل جدید خیلی کوچک و سبک که گوگل معرفی کرد به اسم FunctionGemma را دست کم نگیرید. یه مدل فوقالعاده سبک (فقط ۲۷۰ میلیون پارامتر!) دارید که انقدر کوچیکه که روی گوشیهای معمولی هم راحت اجرا میشه، اما تخصصش فقط یک چیزه: تبدیل حرفهای ما به دستورات برنامهنویسی (Function Calling). میتونید به صورت کاملا رایگان fine tune ش کنید برای کارهای مختلف. اما این مدل به چه دردی میخوره؟ بیاین چندتا مورد جذاب رو بررسی کنیم: ۱. دستیار شخصی کاملاً آفلاین و امن: تا حالا شده بخواین با فرمان صوتی چراغ خونه رو خاموش کنید یا یه تایمر بذارید، ولی چون اینترنت قطع بوده کار نکرده؟ با FunctionGemma، اپلیکیشنها میتونن بدون نیاز به سرور و کاملاً روی خود گوشی، حرف شما رو بفهمن و دقیقاً دکمه یا تابع مربوطه رو اجرا کنن. امنیتش هم عالیه چون هیچ دادهای از گوشی خارج نمیشه. ۲. بازیهای تعاملی نسل جدید: تصور کنید توی یه بازی نقشآفرینی (RPG)، به جای اینکه فقط از بین گزینهها انتخاب کنید، به کاراکتر بگید: «برو از توی صندوقچه اون معجون قرمز رو بردار و بده به سرباز کناری.» این مدل میتونه این جمله رو به کدهای بازی ترجمه کنه و اکشنها رو بلافاصله انجام بده. ۳. اتوماسیون کارهای سیستم: توسعهدهندهها میتونن ابزارهایی بسازن که کارهای تکراری سیستمعامل رو برامون انجام بده. مثلاً بگید: «فایلهای PDF توی پوشه دانلود رو که حجمشون بالای ۱۰ مگه زیپ کن و بفرست به ایمیل علی.» مدل دقیقاً توابع مربوط به مدیریت فایل و ایمیل رو فراخوانی میکنه. ۴. اینترنت اشیاء (IoT) هوشمندتر: توی گجتهای هوشمند که رم و پردازنده خیلی محدودی دارن، FunctionGemma مثل یک جادوگر عمل میکنه. چون فقط به ۵۵۰ مگابایت رم نیاز داره، میتونه مستقیم روی سختافزار لوازم خانگی یا ابزارهای صنعتی نصب بشه تا دستورات پیچیده انسانی رو به زبان ماشین ترجمه کنه. برای fine tune کردنش این بلاگ کامل توضیح میده به همراه کد. Blog:
Mehdi Allahyari26,880 görüntüleme • 5 ay önce

خیلی ها ازم میپرسن که یک نقشه راه خوب برای یادگیری AI معرفی کنم. همیشه میگم یک جواب ثابت نداره و بستگی به اینکه چه مسیرشغلی ای را میخواهید انتخاب کنید، فرق میکنه. اما در حال حاضر یکی از بهترین شغل ها AI Engineer هست. و یکی از بهترین وب سایتها که در مورد کلی شغل، از جمله این، مسیر راه معرفی کرده roadmap .sh هست. خوبیش اینه که میتونید کلیک کنید روی موضوعات مختلف را اطلاعات بیشتر بگیرید. Link:
Mehdi Allahyari51,135 görüntüleme • 1 yıl önce