
Carlos Santana
@DotCSV • 220,047 subscribers
🤖 Divulgador de Inteligencia Artificial (DotCSV) ✉️ Contacto comercial: [email protected] 📚 Enseño sobre IA en Youtube, Tiktok e Instagram
Shorts
Videos

Es de coña y me resulta increíble lo de Grok 4 haciendo búsquedas a las opiniones de Elon Musk para responder cualquier tema controvertido que le plantees. Acabo de hacer la prueba y efectivamente sucede, qué manera más tonta de auto-sabotear a la IA que iba a buscar la "verdad"
Carlos Santana695,084 görüntüleme • 11 ay önce

El fucking robot me ha dado un pisotón y para sorpresa mía, ha pisado fuerte, y me ha hecho daño. Lo viviré con nostalgia como la primera vez que un robot me ha hecho daño cuando dentro de 3 años un enjambre de drones con lanzallamas esté intentando externinarme 🫶
Carlos Santana142,262 görüntüleme • 2 ay önce

Me parece increíble que lo mejor que pueda mostrar Apple en su web sobre su IA sea una edición de imagen súper básica (que hasta el Photoshop con su content-aware te podía resolver) y además que el resultado se note tanto, con lo resuelta que está ya la IA de imagen en 2026...
Carlos Santana112,926 görüntüleme • 3 ay önce

🚨 Update de mi editor de vídeo vibe-codeado Un proyecto que estoy implementado 1) para construirme una herramienta que me va ser súper útil en mi trabajo y 2) para demostrarme lo equivocados que están quienes dicen que vibecodeando no se puede sacar buenos proyectos adelante 👍
Carlos Santana66,602 görüntüleme • 3 ay önce

🔴 ¡DE IMÁGENES A 3D y sin usar NeRF! Esto que estáis viendo aquí no es un vídeo. Tampoco es una recreación hecha con la tecnología NeRF que ya algunos conocéis. Esto es otra cosa: ✨ Gaussian Splatting! Una nueva técnica que usando imágenes como input es capaz de recrear en 3D toda la escena original! Os cuento 🧵
Carlos Santana414,953 görüntüleme • 2 yıl önce

Pues nada... 😅 Aprovechando que ElevenLabs ya tiene soporte multilenguaje, en pocos minutos he clonado mi voz y le he pedido a GPT-4 que programe un script que le ponga mi voz a sus respuestas! Aquí un trozo de conversación. La clonación no es perfecta, pero está hecha sobre 1 minuto de audio y es instantánea!
Carlos Santana302,446 görüntüleme • 3 yıl önce
0:30
Sensitive content
This media may contain sensitive content.

No todos los días uno puede decir que ha conducido un Cybertrack. O mejor dicho, que el Cybertruck le ha conducido a él! Ésta es la primera vez que me he subido a un Tesla con conducción autónoma completa (FSD) basada únicamente en cámaras (sin LIDARs). El coche se ha conducido perfecto por el centro de San Francisco en hora punta con tráfico denso. Simplemente funciona. Y pongo esto ahora que estos días se discute sobre el futuro de la conducción tras el evento de Tesla. Sabéis que en mi caso no me dejo llevar por los deadlines que Musk se inventa o las expectativas infladas que vende en sus eventos. Y aún así os digo que esta tecnología es real, y más allá de los eternos debates en Twitter sobre si sí o sí no, es al probarla y verla funcionar de verdad, la mejor forma de entender que el futuro que viene es inevitable. La conducción del futuro será autónoma y está más cerca de lo que pensamos. Y la batalla no será entre Waymo/Tesla como parece plantearse ahora. Obviamente compiten ambos en un nuevo mercado y es normal compararlos (aquí Tesla tiene la ventaja de un hardware mucho más sencillo basado en pura visión por computador). Pero la realidad es que la verdadera batalla está entre aquellas empresas que son capaces de ofrecer un vehículo que se mueva sólo frente a las que no. La ventaja de las empresas que ya han hecho los deberes y tienen sistemas de conducción autónoma funcionales es enorme frente a las que aún no lo tienen. Y según avancen las regulaciones y ésta tecnología se expanda a cada vez más países, y sea más barata y accesible, este modelo de conducción predominará sobre el anterior. Me he quedado gratamente sorprendido de ver cómo técnicamente algo que parecía imposible ya está resuelto, y de lo poco conscientes que es la mayoría de que esto ya está aquí.
Carlos Santana146,772 görüntüleme • 1 yıl önce

🔴 ¡NUEVO MODELO DE TRADUCCIÓN! Meta acaba de liberar SeamlessM4T, un nuevo modelo de transcripción y traducción MULTIMODAL. Es decir, un modelo que puede tomar como input audio o texto, para generar su traducción también como audio o texto.🗣️🤖 Y de nuevo, OPEN SOURCE! 🔥
Carlos Santana218,025 görüntüleme • 2 yıl önce

Aquí podéis ver un vídeo de casi 4 minutos de DALL•E 3 en funcionamiento en ChatGPT. La herramienta es bestia!
Carlos Santana198,946 görüntüleme • 2 yıl önce