
ぷらぎあ
@plastic_gear • 14,961 subscribers
ストリートロボットエンジニア ※発言は個人の見解であり、所属組織とは関係ありません。 https://t.co/nCWzyjETFV
Shorts
Videos

🫶【Mechanism Study of the Tesla Optimus Hand Patent】🫶 I built a quick functional mock-up yesterday based on the newly published Tesla Optimus hand patent filings. It looks rough because I wanted to validate the mechanism as quickly as possible, but it is fully functional. What impressed me most is that the interesting part is not just the unusual joint geometry itself. My reading is that the real elegance of this design is in reducing active cable count by using an elastic return / bias element instead of another extensor-side cable, while routing the distal control cable through the proximal joints carefully enough that distal motion remains controllable with reduced unwanted coupling. The rolling-contact style joint also works surprisingly well in practice. What I respect most about these filings is that they do not read like “look at this clever mechanism.” They read like a serious attempt to solve the real problems of a tendon-driven humanoid hand: cable count, routing through multiple joints, manufacturability, and assembly. There is a very strong sense here that the design was pushed not only toward motion, but toward production. This mock-up is simplified for functional reproduction. My prototype uses a single-resin flexure, not the multilayer composite flexible member described in the patent filings, so the extension-side hysteresis is probably not representative of the intended behavior. I also did not fully reproduce the cable-support / control-channel geometry shown in the filings, so some residual inter-joint crosstalk remains in this mock-up. WO2026/080687 A1 WO2026/080690 A1 WO2026/080691 A1 WO2026/080693 A1 WO2026/080701 A1
ぷらぎあ269,152 просмотров • 1 месяц назад

Apple Silicon 搭載の MacBook Pro M1 Max 64GB 上で、完全ローカル動作する日本語音声対話アシスタントを構築しています。 音声認識から応答生成、音声合成まで、実行時の処理はすべてローカル動作でネットに繋がっていなくても動きます。 現在の中核構成は、mlx-whisper(mlx-community/whisper-large-v3-turbo) → LM Studio Local Server 上の gemma-4-26b-a4b → Irodori-TTS-500M-v2。 今回は、Irodori-TTS の VoiceDesign で実在しない話者の参照音声を生成し、その参照音声を用いて一貫性のあるゼロショット音声クローンを行う構成にしています。 つまり、ローカル環境内で設計した話者によって対話音声を生成しています。 (実在人物のクローン行為ではありません) まだ改良中ですが、クラウドAPIなし・実行時の外部通信なしで、ここまで自然な日本語音声対話が成立するのはかなり面白いです。 原理的にストリーミングTTSに対応しないためレスポンスが少し遅いですが、ここを誤魔化す技術について考え中です。
ぷらぎあ35,705 просмотров • 1 месяц назад
Больше нет контента для загрузки