ViaInfo: enero 2025

miércoles, 22 de enero de 2025

IA para Desarrollo de Software

La siguiente es una enumeración de herramientas, algunas probadas y otras no.

(*) Evaluada de utilidad.

(**) Ya utilizada en Vía Informática.

Herramientas no-code, basadas en prompts, para generar aplicaciones:

Replit: Plataforma en línea para desarrollar, colaborar y desplegar aplicaciones en múltiples lenguajes de programación.
Incluye Replit Ghostwriter, un asistente de IA para sugerencias de código, generación y depuración.
Ideal para proyectos educativos, prototipos rápidos y colaboración.
Enfoque intuitivo, accesible para desarrolladores de todos los niveles.
No requiere configuraciones complejas.

Agnet-Zero: Framework de IA de propósito general que se adapta dinámicamente a las tareas del usuario.
Diseñado para agentes inteligentes personalizados con capacidades de aprendizaje continuo, ejecución de código y navegación web.
Más orientado a usuarios avanzados que necesitan personalización.
Dada una tarea se encargará de recopilar información, ejecutar comandos y código, colaborar con otras instancias de agentes y hacer todo lo posible por cumplirla. No está preprogramado para tareas específicas (aunque puede configurarse para ello). Cuenta con una memoria persistente, lo que le permite recordar soluciones previas.
Necesita más conocimientos técnicos para personalización y configuración.
Ver canal de YouTube y Comunidad.

Herramientas y Asistentes de IA para Programación

GitHub Copilot (**)
Asistente de codificación basado en IA que sugiere líneas o bloques de código en tiempo real.
Tabnine
Autocompletado inteligente para múltiples lenguajes y entornos.
CodeT5
Modelo avanzado para generación, traducción y depuración de código.
Replit Ghostwriter
Generador de código y depurador en la plataforma Replit.
DeepCode
Analiza código en busca de errores y vulnerabilidades.
Sourcegraph Cody
Responde preguntas contextuales sobre tu base de código.
IntelliCode (**)
Extensión de Visual Studio con sugerencias basadas en patrones de uso.
AWS CodeWhisperer
Asistente que genera fragmentos de código para trabajar en el ecosistema AWS. Hay extensiones para VS Code, JetBrains, Eclipse, etc.
Codiga
Analiza código para encontrar problemas y compartir fragmentos reutilizables. Security-focused (OWASP 10, MITRE CWE, Sans/CWE Top 25)
Snyk Code
Identifica vulnerabilidades en el código fuente.
OpenAI Codex
Modelo para generar código y realizar traducciones entre lenguajes. Desciende de GPT-3 y se aplica mayormente en Python para generar partes de código basadas en librerías, APIs o funciones ya existentes.
BlackBox AI
Herramienta para buscar fragmentos de código dentro de tus proyectos.
Phind
Motor de búsqueda técnico optimizado para desarrolladores.

Plataformas y Frameworks con IA Integrada

Microsoft Azure AI (*)
Plataforma de desarrollo de software y soluciones empresariales con IA integrada para automatización y análisis.
Google Vertex AI
Plataforma de Google Cloud que combina aprendizaje automático y análisis avanzado.
IBM Watson Studio
Herramienta para construir modelos de IA e integrarlos en aplicaciones empresariales.
Amazon SageMaker
Framework para entrenar y desplegar modelos de machine learning con herramientas automatizadas.
OpenAI API (**)
Proporciona acceso a modelos como GPT y Codex para generar texto, código y realizar análisis.
Hugging Face Transformers
Biblioteca avanzada para integrar modelos de IA en proyectos de desarrollo.
PyCaret
Framework de código abierto para simplificar el flujo de trabajo de machine learning.
TensorFlow
Biblioteca de código abierto para construir y entrenar modelos de aprendizaje profundo.
PaddlePaddle
Framework de aprendizaje profundo optimizado para la producción a gran escala.
LangChain
Framework para desarrollar aplicaciones impulsadas por modelos de lenguaje (LLMs).
Streamlit
Framework para crear rápidamente aplicaciones de datos interactivas impulsadas por IA.
Gradio
Herramienta para construir interfaces de usuario interactivas para modelos de machine learning.
MLflow
Plataforma para gestionar el ciclo de vida de proyectos de machine learning.
FastAPI
Framework de Python ideal para construir APIs. Se basa en Starlette y Pydantic, y destaca por su rapidez, validación automática de datos, documentación interactiva y facilidad de uso.
Django + AI Extensions
Framework web que se puede extender con bibliotecas de IA para ofrecer capacidades avanzadas.
Cortex
Plataforma para desplegar modelos de machine learning a escala en Kubernetes.
Back4App
Plataforma Backend-as-a-Service (BaaS) basada en Parse que permite a los desarrolladores crear, alojar y escalar aplicaciones backend sin necesidad de administrar servidores. Se utiliza para desarrollar aplicaciones móviles y web de forma rápida y eficiente, proporcionando base de datos en la nube, autenticación de usuarios, funciones en la nube, APIs REST y GraphQL, y notificaciones push. También tiene un agente de IA interesante.

Otras Herramientas Complementarias

Appwrite
Backend de desarrollo que incluye integraciones para IA en aplicaciones.
Retool
Crea aplicaciones internas con funciones de IA para mejorar la productividad.
Postman AI (**)
Herramienta para gestionar APIs, incluyendo capacidades de análisis y optimización de requests con IA.
Rasa
Framework de código abierto para construir asistentes virtuales y chatbots impulsados por IA.
NSwag
Genera clientes para consumier APIs. Se puede instalar el paquete de NuGet para ASPNetCore.
SonarQube
Plataforma de código abierto para inspección continua de calidad del código a través de diferentes herramientas de análisis estático de código fuente.
Selenium
Plataforma de código abierto para automatizar pruebas de aplicaciones web a través de distintos browsers. Sirve para automatizar cualquier tarea que se pueda llevar a cabo con browsers.
Apache JMeter (**)
Herramienta de código abierto que permite realizar pruebas de rendimiento, funcionales y de carga en aplicaciones web.
Figma (*)
Herramienta de diseño colaborativo basada en la nube que se utiliza para la creación de interfaces de usuario, prototipos interactivos y diseño gráfico. Es una de las principales herramientas utilizadas por diseñadores UI/UX debido a su facilidad de uso y capacidades colaborativas en tiempo real, con características off-line adicionales habilitadas por aplicaciones de escritorio en macOS y Windows.
Clutch.io (para desarrollos low-code)
Es una plataforma avanzada de desarrollo web visual que combina rapidez y familiaridad de las herramientas de diseño con el poder de las herramientas de desarrollo. Está diseñada para ayudar a los diseñadores web profesionales a crear sitios de alto rendimiento con libertad visual y funcional. Se combina bien Xano pero puede utilizarse también con cualquier otro tipo de back-end.
Xano (low-code)
Herramienta no-code para construir back-ends escalables.
Codebots
Plataforma de ingeniería de software que utiliza bots para automatizar gran parte del proceso de desarrollo. Tiene un Angularbot optimizado para Angular 17. Como la versión de Angular 19 es nueva (a enero de 2025) hay que ver si Angularbot ya lo soporta.
Mermaid.js
Biblioteca de JavaScript que permite generar diagramas a partir de texto escrito en una sintaxis específica, similar a Markdown. Es ampliamente utilizada en entornos de documentación y desarrollo, ya que permite crear diagramas de flujo, diagramas de secuencia, Gantt charts, y más, sin necesidad de herramientas gráficas.
Formly (No necesario)
Biblioteca de Angular que permite crear formularios dinámicos y altamente configurables. Sin embargo con Angular Reactive Forms se puede hacer lo mismo, escribiendo algo más de código.

Herramientas y Frameworks de ML

Herramientas permiten su implementación on-premise, con requisitos mínimos de hardware:

Scikit-learn: Herramienta de machine learning en Python que proporciona algoritmos para clasificación, regresión, clustering y reducción de dimensionalidad.
FastAPI: Framework web en Python que permite crear APIs rápidas y eficientes, con soporte para validación automática de datos usando modelos Pydantic y OpenAPI.
Apache MXNet: Framework de deep learning altamente escalable con soporte para múltiples lenguajes como Python, R, Scala y Julia.
Microsoft ML.NET: Framework de aprendizaje automático para desarrolladores .NET, que permite construir modelos de machine learning sin necesidad de cambiar de ecosistema.
RapidMiner: Plataforma de ciencia de datos que permite el desarrollo rápido de modelos de aprendizaje automático mediante interfaces visuales.
H2O.ai: Automatizan tareas de machine learning como selección de modelos, ajuste de hiperparámetros y evaluación.
Jupyter Notebook: Entorno interactivo para escribir y ejecutar código en Python, ideal para experimentación con modelos de IA y visualización de resultados.

Herramientas permiten su implementación on-premise y requieren una GPU NVIDIA con soporte para CUDA (opcional para aceleración de cálculo) :

TensorFlow: Framework de código abierto desarrollado por Google para construir y entrenar modelos de aprendizaje automático y redes neuronales.
PyTorch: Biblioteca de machine learning de código abierto desarrollada por Facebook, conocida por su flexibilidad y soporte para investigación en IA.
Keras: API de alto nivel para redes neuronales construida sobre TensorFlow, enfocada en facilitar el desarrollo de modelos de aprendizaje profundo.
Hugging Face Transformers: Biblioteca para el uso de modelos de lenguaje preentrenados (como GPT, BERT, T5) con compatibilidad para PyTorch y TensorFlow.
OpenAI Codex: IA de OpenAI diseñada para comprender y generar código en varios lenguajes de programación, incluida la integración con GitHub Copilot.
Caffe: Framework de deep learning diseñado para aplicaciones de reconocimiento visual y procesamiento de imágenes, conocido por su eficiencia.

Herramientas dependientes de la nube o con opciones limitadas para on-premise:

Google Vertex AI: Plataforma que permite entrenar, desplegar y gestionar modelos de IA en la nube de Google con herramientas avanzadas para análisis y optimización.
IBM Watson Studio: Herramienta de IA que ofrece capacidades de machine learning, deep learning y análisis avanzado para resolver problemas de negocio complejos.
Tableau: Herramienta para visualización de datos con soporte para integraciones de modelos de machine learning y predicciones basadas en IA.
DataRobot: Plataforma que automatiza el proceso de construcción, entrenamiento y despliegue de modelos de machine learning y deep learning.

Google AutoML: Herramienta que automatizan tareas de machine learning como selección de modelos, ajuste de hiperparámetros y evaluación.

martes, 21 de enero de 2025

ChatBots y Modelos de LLM

Chatbots

Inicialmente surgieron para brindar servicios de atención al cliente:

Zendesk Chat
Intercom
Drift

Frameworks para armar chatbots más personalizados:

Rasa: Open-source y personalizable.
Microsoft Bot Framework: Para integrar con Azure y otras plataformas.
Dialogflow: Plataforma de Google Cloud para crear chatbots basados en IA.

Modelos de LLM :

Modelos de OpenAI (GPT-4, GPT-3.5, etc.): Disponibles a través de APIs comerciales.
Hugging Face Transformers: Modelos open-source como BERT, GPT-Neo, LLaMA o Falcon que puedes entrenar o afinar localmente.
Google Vertex AI: Ofrece acceso a modelos de PaLM y otros.
Azure OpenAI Service: Acceso a modelos de OpenAI con integración empresarial.
Anthropic Claude: Otra opción para modelos de lenguaje avanzados.

Para estructurar datos:

Pipelines ETL: Extraer, transformar y cargar datos (Apache Spark, Pandas).
Herramientas de indexación: para convertir los datos en un formato accesible.

LangChain: Para conectar datos y LLMs de manera estructurada.
Haystack: Framework para construir pipelines de NLP basados en búsqueda.
Pinecone, Weaviate, o Milvus: Bases de datos vectoriales para búsquedas semánticas.

Asistentes de voz:

Las herramientas tienen costos asociados por minuto de uso.

Retell: el mejor para idioma español, con menos latencia y más económico.
Synthflow: soporta modelos de lenguaje LLM. Permite enviar SMS, hacer real time booking y ofrece integración nativa con GoHighLevel, Zapier y otros.
Bland.AI
Vapi
Air

Normalmente utilizan Twillio para realizar llamadas por teléfono.

lunes, 20 de enero de 2025

Asistentes y Aplicaciones de IA Varios

A continuación mencionamos las aplicacioens de IA más conocidas hasta el momento.

A medida que avanzamos en el análisis de algunas categorías, se nos hace necesario crear nuevas entradas en el blog para poder volcar más información. Este es el caso de:

- Automatización y Agentes de IA
- IA para Planificación de Viajes
- IA aplicada a la Construcción
- ChatBots y Modelos de LLM/RAG

Asistentes Personales y Compañeros Digitales

Suelen responder preguntas, administrar calendarios, controlar dispositivos inteligentes.

Las más conocidas son las que vienen incorporadas en los celulares y sistemas operativos:

Siri
Alexa
Google Assistant

Compañeros digitales más avanzados son:

Character.AI: Diseña compañeros virtuales. Ideal para entretenimiento y simulaciones específicas.
Replika: permite generar un Avatar, un amigo virtual que ayuda con apoyo emocional y social. Ofrece conversaciones relajadas, ejercicios de bienestar, y escucha activa.
Woebot: Terapeuta virtual basado en IA para mejorar la salud mental.

Suplantación de Identidad

Deepfakes (video e imágenes): crear videos falsos en los que alguien parece decir o hacer algo que nunca ocurrió.
Voice Synthesis: replicar patrones vocales a partir de grabaciones existentes.
Text Spoofing: imitar el estilo de escritura de una persona.
Image Spoofing: manipular o crear de imágenes realistas con IA.

Herramientas para clonarte en video:

Synthesia: Permite crear un avatar digital a partir de tu imagen y voz para generar videos con texto como entrada.
Avatarify: Software de código abierto que te permite controlar un avatar en tiempo real usando tus expresiones faciales.
DeepBrain AI: Crea un avatar hiperrealista a partir de un video tuyo, que luego puedes usar para generar contenido con texto o guiones.
HeyGen (antes Movio): Permite crear videos con avatares personalizados que incluyen movimientos faciales y sincronización de labios.
D-ID: Ofrece la posibilidad de crear videos a partir de una foto estática de ti mismo combinada con texto o audio.

Herramientas para clonarte tu voz:

ElevenLabs: Clona tu voz con alta precisión para generar audios personalizados.
Respeecher: Genera una clonación perfecta de tu voz para contenido creativo.

Procesamiento de Lenguaje Natural (NLP)

Análisis de texto, generación de contenido, corrección gramatical.

Grammarly
Jasper
Copy.ai

Análisis de Datos e Inteligencia de Negocios

Visualización de datos, generación de reportes, consultas en lenguaje natural.

Tableau con Ask Data
ThoughtSpot.

Educación y Aprendizaje

Personalización del aprendizaje, generación de ejercicios, retroalimentación.

Duolingo
Khan Academy con AI
Quizlet

Creación de Imágenes

Crear ilustraciones, gráficos, renders, o imágenes a partir de texto.

DALL·E
MidJourney
Stable Diffusion
ChatGPT Plus (se conecta con DALL-E): Puedes describir con palabras lo que necesitas y DALL·E creará una imagen basada en esa descripción.

Creación de Audio

Composición de música, creación de narraciones, síntesis de voz.

Hailuo AI Audio: Speech Synthesis. Excelente generación de voz a partir de textos. Tiene una gran cantidad de tipos de voces e idiomas. Se puede agregar "emosión" y cambiar la velocidad de la narración. Excelente!

Descript
AIVA
Murf.ai.

Generación de Textos

Escritura de artículos, copywriting, generación de diálogos o guiones, traducciones.

ChatGPT: El más utilizado y primero en salir al mercado.

Google Bard (Gemini): Generación de texto creativo, integración con servicios de Google.

Microsoft Bing AI: Búsquedas en tiempo real, respuestas actualizadas.

Hailuo AI Chat: ¿Le pisa los talones o supera a ChatGPT? Hay que probarlo. Soporta mucho más contexto (4M) y está enfocado en la interacción emocional y la comprensión del contexto humano. Apoyo emocional y consejos.

IBM Watson Assistant: Atención al cliente, soporte técnico, integración con sistemas empresariales.

Jasper: Generación de contenido, redacción de textos publicitarios, creación de contenido para redes sociales.

Copy.ai: Generación de texto, redacción de correos electrónicos, creación de contenido para marketing.

Generación de Video

Edición de video asistida, creación de videos a partir de texto, deepfake.

Hailuo Video: Impresionante generador de video a partir de texto, a partir de una imagen y generación de personajes dentro de una escena.

Runway
Synthesia
Pictory

Generación de Modelos 3D

Creación de modelos 3D a partir de imágenes o descripciones.

NVIDIA Omniverse
Kaedim

Edición y Mejora Creativa

Mejora automática de fotos, sugerencias de diseño, ajustes asistidos.

Canva con Magic Write
Adobe Sensei.

Generación Multimodal (Texto a Imagen, Audio, Video, etc.)

Transformar texto en múltiples formatos creativos como imágenes, videos o audios.

Runway Gen-2
Hugging Face (text-to-image models)

Analizar Videos y Resumir Ideas

Otter.ai: Transcribe automáticamente el audio de un video y utiliza NLP para generar resúmenes de las ideas principales. Ideal para reuniones o conferencias. Compatible con Zoom, Google Meet y videos subidos directamente.
Derscript: Transcripción automática y edición basada en texto; permite identificar ideas clave y eliminar fragmentos irrelevantes. Integra edición de video y herramientas de resumen.
Trint: Transcribe videos y genera resúmenes o puntos clave. También permite la edición colaborativa del contenido transcrito. Muy útil para periodistas y creadores de contenido.
Wisecut: Transcribe y genera resúmenes automáticos de videos largos, eliminando silencios y pausas. Fácil de usar, especialmente para ediciones rápidas.
Rephrase.ai: Utiliza inteligencia artificial para resumir ideas clave de videos. También puede convertir texto en videos personalizados. Compatible con varios idiomas y plataformas.
Video Insights de IBM Watson Media: Extrae automáticamente resúmenes e ideas clave de contenido de video mediante análisis de lenguaje y reconocimiento de imágenes. Potente herramienta empresarial con análisis avanzado.
InVideo: Transcribe audio de video y permite resaltar y extraer puntos clave. Incluye opciones de edición adicional y mejora visual.
Microsoft Stream: Genera transcripciones automáticas de videos y permite buscar palabras clave dentro del contenido transcrito. Integrado en la suite de Microsoft 365, útil para uso corporativo.

Aplicaciones de Salud

Diagnósticos iniciales, terapia conversacional, seguimiento de salud.

Ada Health
Woebot
Babylon Health

Gaming e IA Narrativa

Generación de historias, personajes interactivos.

AI Dungeon
Replica.

Gestión y Productividad

Resúmenes automáticos, toma de notas, planificación.

Notion AI
Otter.ai: Transcribe automáticamente el audio de un video y utiliza NLP para generar resúmenes de las ideas principales. Ideal para reuniones o conferencias.
15minuteplan.ai: Genera planes de negocio.

E-commerce y Recomendaciones

Personalización de productos, chatbots para ventas.

Shopify con AI
Amazon Personalize

Otras Aplicaciones

En esta categoría entran algunas Apps recomendadas fuera de serie.

Simple Sing: My Singing App - Adapta cualquier cansión a tu tono de voz para poder cantarla sin problemas.

Plataformas

Estas son las plataformas más conocidas que ofrecen generación de imágenes mediante inteligencia artificial, organizadas por su popularidad y enfoque:

MidJourney

Descripción: Plataforma muy reconocida por su capacidad para crear imágenes artísticas y visualmente impresionantes a partir de texto.
Acceso: Funciona principalmente a través de Discord.
Usos Destacados: Arte conceptual, diseño gráfico, creación de portadas de libros.

DALL·E 2 (de OpenAI)

Descripción: Creado por OpenAI, genera imágenes detalladas a partir de texto y permite edición en las imágenes generadas.
Acceso: Directamente desde OpenAI o a través de la integración con ChatGPT Plus.
Usos Destacados: Imágenes conceptuales, ilustraciones personalizadas.

Stable Diffusion

Descripción: Una plataforma de código abierto para generación de imágenes, que permite personalizaciones avanzadas.
Acceso: A través de interfaces como DreamStudio, Automatic1111 o aplicaciones independientes.
Usos Destacados: Creación de imágenes únicas, diseño técnico, experimentación.

Runway ML

Descripción: Plataforma multimodal que no solo genera imágenes, sino también videos, permitiendo edición y creación avanzada.
Acceso: Basado en navegador; ideal para creadores multimedia.
Usos Destacados: Generación de videos, prototipos creativos, efectos visuales.

Artbreeder

Descripción: Especializado en modificar y generar retratos o imágenes estilizadas mediante IA.
Acceso: Plataforma en línea con herramientas simples para usuarios principiantes.
Usos Destacados: Diseño de personajes, retratos, arte conceptual.

DeepAI

Descripción: Proporciona herramientas básicas para la generación de imágenes, enfocándose en simplicidad y resultados rápidos.
Acceso: Basado en navegador; ideal para uso casual.
Usos Destacados: Generación rápida de conceptos, bocetos básicos.

NightCafe Studio

Descripción: Enfocado en la creación de obras de arte mediante diferentes algoritmos de IA.
Acceso: Plataforma en línea con opciones gratuitas y de pago.
Usos Destacados: Arte digital, murales, diseño decorativo.

Fotor (AI Art Generator)

Descripción: Herramienta simple y amigable para usuarios no técnicos, con un enfoque en diseño y marketing.
Acceso: En línea y como app móvil.
Usos Destacados: Publicidad, diseño gráfico rápido.

Craiyon (antes DALL·E Mini)

Descripción: Versión simplificada de DALL·E, accesible y gratuita, aunque con resultados más básicos.
Acceso: Basado en navegador.
Usos Destacados: Experimentación casual.

Factores para Elegir una Plataforma

Calidad de las imágenes: MidJourney y DALL·E destacan por su realismo y creatividad.
Facilidad de uso: NightCafe y Fotor son ideales para principiantes.
Costo: Stable Diffusion (gratuito en local) y Craiyon son opciones económicas.
Flexibilidad: Stable Diffusion y Runway ML son muy personalizables.

martes, 14 de enero de 2025

IA para Planificación de Viajes

Ampliamente conocidos y confiables, con una gran base de usuarios y funciones sólidas.

Google Travel: organiza automáticamente toda la información sobre tus reservas de vuelos, hoteles y actividades, generando un itinerario personalizado para tu viaje. Sugiere lugares y actividades basadas en tus preferencias y datos históricos de otros viajeros. Se puede acceder sin conexión a internet.

TripIt: organiza todos los detalles de tu viaje con sólo reenviar tus correos de confirmación. Genera un itinerario con todos los vuelos, hoteles y actividades. Además, te ofrece actualizaciones en tiempo real sobre cualquier cambio o retraso en tu viaje.

Trips by TripAdvisor: la plataforma de viajes TripAdvisor ofrece Trips, un asistente de IA que te facilita la planificación de itinerarios personalizados.

Sygic Travel: ofrece guías de viaje detalladas y crea itinerarios personalizados basados en tus intereses y el tiempo disponible.

Destaca por su singularidad al ofrecer rutas de transporte, complementando perfectamente otras herramientas.

Rome2Rio: proporciona información sobre rutas de transporte entre casi cualquier lugar del mundo, comparando vuelos, trenes, buses, ferries y más. Es ideal para encontrar la mejor manera de desplazarse.

Para planificaciones detalladas y personalizadas.

Travel GPT: asistente de viajes basado en IA que te permite seleccionar tu idioma de preferencia (entre varios, como español, inglés o alemán) y luego buscar destinos. A diferencia de otras herramientas, Travel GPT genera una guía de viaje completa sobre el lugar que planeas visitar, cubriendo aspectos como historia, clima y cultura.

Wonderplan: ingresando tu destino, presupuesto, duración del viaje y con quién viajas, y la IA generará un itinerario completo, detallado por día. Además, la app te muestra el tiempo estimado en cada atracción y te ofrece un desglose de los costos. Es una de las apps con más descargas.

Trip Planner AI: se destaca por ser una aplicación completa que no sólo te ayuda a crear tu itinerario, sino que también te permite reservar vuelos, hoteles y actividades en un solo lugar.

Ask Layla: es una herramienta de IA que actúa como tu agente de viajes personal. Layla te ayuda a encontrar destinos, reservar vuelos y hoteles, y descubrir actividades personalizadas para tu viaje. Está vinculado a Trip Planner AI.

iPlan.AI: diseñada para crear itinerarios personalizados en función de cinco aspectos clave: propósito del viaje, intereses, acompañantes, duración y presupuesto.

GuideGeek: asistente de viajes impulsado por IA que puedes usar directamente desde WhatsApp, Messenger o Instagram. También ofrece recomendaciones personalizadas basadas en tu ubicación y preferencias.

Trip Notes / Dorsia: asistente de IA que te proporciona recomendaciones basadas en tus preferencias de viaje. Ya sea que busques un buen lugar para brunch o los mejores puntos turísticos para un fin de semana, esta app te ofrece un mapa interactivo con descripciones detalladas de cada lugar, ayudándote a descubrir rincones únicos durante tu viaje.

Vacay Chatbot: asistente virtual que sugiere recomendaciones personalizadas de lugares y actividades, y te ayuda a crear un itinerario completo, desde el vuelo hasta las actividades diarias. Cuenta con asistentes virtuales especializados en diferentes tipos de viajeros, como familias, viajeros de lujo o quienes buscan gemas ocultas en el destino.

Wanderboat: ayuda a planificar tu viaje con un asistente de IA que destaca en la búsqueda rápida de actividades, restaurantes y rutas personalizadas.

Roam Around: una app simple pero efectiva que utiliza la IA de ChatGPT para ayudarte a planificar viajes detallados.

Roadtrippers: ideal para los viajes por carretera. Sugiere las mejores rutas y paradas a lo largo del camino, destacando atracciones, restaurantes y alojamientos.

lunes, 13 de enero de 2025

IA aplicada a la Construcción

La inteligencia artificial (IA) está revolucionando la industria de la construcción, especialmente en áreas como saneamiento, obras hidráulicas, infraestructura vial, túneles, puertos, dragados, tratamientos costeros, arquitectura y energía.

Análisis predictivo para la toma de decisiones

La inteligencia artificial trasciende el análisis convencional, anticipando necesidades y riesgos en tiempo real.

Previsión de sobrecostos en proyectos: Las redes neuronales permiten utilizar datos de proyectos anteriores, a fin de establecer modelos predictivos en futuros proyectos, mediante el análisis de los diferentes procesos de la construcción y el establecimiento de hitos claves.

Optimización de diseños: BIM (Building Information Model) es un modelo único que integra los diferentes planos, incluyendo la información estructural, arquitectónica y de instalaciones. Los diferentes agentes implicados en la construcción, deben volcar toda su información a este modelo único, a fin de mediante la utilización de algoritmos de aprendizaje automático, poder predecir posibles conflictos, minimizar sus efectos y generar alternativas válidas.

Gestión de Riesgos y Mitigación de accidentes: La construcción es el sector económico que mayor tasa de accidentabilidad presenta. La inteligencia artificial se está utilizando para realizar una monitorización y evaluación continua del espacio de construcción, y así evitar y mitigar los posibles riesgos.

Optimización de recursos: Se mejora la asignación de maquinaria y personal, anticipando y resolviendo conflictos de programación.

Monitoreo y Mantenimiento preventivo: Se pronostica el desgaste de equipo, programando mantenimientos antes de que se presenten averías.

Sostenibilidad y Eficiencia Energética: Los diseños generados con el apoyo de IA pueden analizar el ciclo de vida, permitiendo crear estructuras que sean energéticamente eficientes, proponiendo esquemas de uso eficiente y sostenible.

CarbonCure Technologies incorpora IA para optimizar los diseños de mezclas de hormigón que secuestran dióxido de carbono durante el proceso de curado. Analizando los datos de los productores de hormigón y las condiciones ambientales, la plataforma de IA de CarbonCure ajusta las proporciones de las mezclas para mejorar la sostenibilidad sin comprometer la integridad estructural.

Control de mano de obra: Las empresas de construcción están también utilizando el aprendizaje automático para planificar mejor la distribución de mano de obra y maquinaria en los puestos de trabajo. Un robot evalúa constantemente el progreso del trabajo y la ubicación de cada uno de los operarios y equipos. Con esta información, una red neuronal decide cual es el lugar óptimo de cada trabajador en cada una de las fases de la construcción.

Drones y AI en la supervisión de proyectos

Con la implementación de drones equipados con inteligencia artificial, las inspecciones de obras se tornan más eficientes y seguras. Los drones pueden capturar datos visuales de áreas de difícil acceso, reduciendo riesgos laborales y optimizando el tiempo de supervisión.

La integración de imágenes y datos en tiempo real mejora la toma de decisiones. Al incluir algoritmos de aprendizaje profundo, los drones interpretan datos visuales para identificar anomalías constructivas y verificar el cumplimiento de las especificaciones técnicas.

La empresa Firmatek, especializada en la recopilación de datos mediante drones, utiliza algoritmos de IA para procesar imágenes aéreas y datos LiDAR para realizar levantamientos topográficos y cálculos volumétricos precisos.

Robots AI en tareas de construcción autónoma

La integración de robots AI en la construcción autónoma promete una revolución en la eficiencia y precisión de las tareas.

Automatización de procesos constructivos: Implementación de robots capaces de ejecutar tareas repetitivas con alta precisión.

Supervisión y corrección autónoma: Sistemas AI que monitorean constantemente el progreso y ajustan las operaciones en tiempo real.

Logística optimizada: Robots AI encargados de la gestión y transporte de materiales en la obra.

Colaboración humano-robot: Desarrollo de sistemas que permiten la interacción segura y efectiva entre trabajadores y robots.

BIM (Building Information Modeling)

El Building Information Modeling (BIM) es un método de gestión colaborativa de construcciones que combina datos e información en un modelo 3D. Permite generar un modelo de la construcción que contiene información sobre todo el ciclo de vida de la obra, desde el diseño hasta la construcción, y hasta su demolición y desmantelamiento.

Además de una representación tridimensional, con el BIM es posible crear un modelo informativo dinámico, interdisciplinario y compartido que contiene datos sobre geometría, materiales, estructura portante, características térmicas y rendimiento energético, instalaciones, costos, seguridad y mantenimiento.

Para lograr esto, BIM integra a todos los agentes que intervienen en el proceso, ya sean arquitectos, ingenieros, constructores, propietarios, especialistas, etc. Esto facilita la colaboración y comunicación entre las partes, ya que se trabaja desde un único modelo con información basada en datos reales.

La metodología BIM centraliza toda la información del proyecto en un único modelo de información creado por todos los agentes participantes. Incluso puede incluir los productos necesarios para materializar la obra, incorporando al modelo sus características, costo e información de contacto para comprarlos.

jueves, 9 de enero de 2025

Análisis de Textos

Las siguientes son herramientas y frameworks que estamos analizando, orientados al anlálisis de textos y extracción de entidades.

On Premise

SpaCy

Una de las bibliotecas más populares para procesamiento de lenguaje natural. Tiene soporte para modelos preentrenados en español.

Reconocimiento de entidades nombradas (NER).
Posibilidad de entrenar modelos para textos legales.

Se puede integrar en C# utilizando el servicio Python REST API con Flask o FastAPI y realizando llamadas HTTP desde la aplicación.

Hugging Face Transformers

Plataforma para utilizar modelos como BERT y RoBERTa, con soporte en español y entrenados para tareas como NER.

Modelos como BETO o mBERT entrenados para textos en español.
Alta precisión para dominios especializados (como demandas legales).

Se puede crear un servicio REST API en Python o Node.js y luego llamarlo desde C#.

Stanford NLP

Biblioteca potente para análisis sintáctico y semántico, con soporte multilenguaje (incluido español).

Reconocimiento de entidades nombradas (NER).
Compatibilidad con textos largos y complejos.

Se puede implementar el servidor CoreNLP y realizar solicitudes HTTP desde una aplicación C#.

Servicios en la nube

Google Cloud Natural Language API

Extracción de entidades.
Análisis de sintaxis y sentimientos.

AWS Comprehend

Reconocimiento de entidades personalizadas (Custom Entity Recognition).
Entrenamiento con conjuntos de datos legales.

Azure Cognitive Services - Text Analytics

Reconocimiento de entidades estándar y personalizadas.
Escalabilidad e integración nativa con el ecosistema Azure.

Frameworks Open Source con Modelos Personalizables

NERD (Named Entity Recognition Dashboard)

Framework para desarrollar modelos personalizados de extracción de entidades.

Basado en herramientas como SpaCy o Hugging Face.
Útil para etiquetar textos y entrenar modelos adaptados.

Doccano

Herramienta de etiquetado para entrenar modelos personalizados de NLP.

Útil para generar datasets y entrenar herramientas como SpaCy o Transformers.

Prodigy

Herramienta de etiquetado para entrenar modelos personalizados de NLP.

Útil para generar datasets y entrenar herramientas como SpaCy.
Costo $390 lifetime x site (Personal).

Herramientas Especializadas en el Dominio Legal

Soluciones preconstruidas de LegalTech.

ROSS Intelligence

Plataforma diseñada para documentos legales, incluyendo análisis de contratos y demandas.

Legal Robot

Ofrece soluciones para procesar documentos legales y extraer datos clave.

jueves, 2 de enero de 2025

Retrieval Augmented Generation (RAG)

RAG es un enfoque en el campo de la inteligencia artificial que combina modelos de recuperación de información con modelos generativos de lenguaje para mejorar la precisión y la relevancia de las respuestas generadas. Este enfoque permite que los modelos generativos accedan a información externa en tiempo real, lo que es útil para manejar tareas que requieren datos actualizados o específicos, como responder preguntas basadas en documentos o ejecutar búsquedas dinámicas.

Fuente: What is retrieval augmented generation (RAG)

¿Cómo funciona RAG?

Componente de Recuperación (Retriever):
- Identifica información relevante a partir de una base de datos, corpus de texto, o fuente externa.
- Métodos comunes:
  - Sistemas tradicionales: TF-IDF, BM25.
  - Modelos de embeddings: Dense retrievers como DPR (Dense Passage Retrieval) que utilizan vectores para comparar similitudes semánticas.
Componente Generativo (Generator):
- Toma los documentos recuperados y genera una respuesta basada en la información contenida en ellos.
- Modelos típicos: GPT, T5, o BART.
Pipeline completo:

Dado un input (como una pregunta), el retriever busca información relevante, y el generator usa esta información para crear una respuesta natural y contextual.

Ejemplos de uso de RAG

Chatbots empresariales:
- Responden preguntas específicas sobre documentos de política interna, bases de conocimiento o contratos legales.
- Ejemplo: Un chatbot que accede a manuales de empleados para responder preguntas sobre beneficios.
Sistemas de búsqueda mejorados:
- Motores de búsqueda que combinan la recuperación con respuestas explicativas.
- Ejemplo: Un motor de búsqueda académico que genera un resumen de los papers relevantes.
Asistentes de soporte técnico:
- Generan instrucciones personalizadas basadas en guías técnicas.
- Ejemplo: Un asistente que ayuda a resolver problemas técnicos con base en manuales de productos.
Generación de contenido personalizado:
- Utilizado para redactar informes o resúmenes basados en datos recopilados.
- Ejemplo: Herramientas que generan reportes financieros combinando datos recientes.

Ejemplos de modelos RAG existentes

Dense Passage Retrieval (DPR):
- Combina embeddings densos con modelos generativos.
- Ejemplo de uso: Enriquecer respuestas en asistentes virtuales.
Google Bard y OpenAI ChatGPT con Plugins:
- Usan fuentes externas en tiempo real para recuperar información y generar respuestas.
RAG Framework (Meta AI):
- Combina retrieval y generación utilizando modelos como BART para respuestas basadas en contexto.
Haystack (de deepset):
- Framework modular de código abierto para implementar sistemas de preguntas y respuestas basados en RAG.

Recursos para desarrollar un sistema RAG

1. Bibliotecas y herramientas

Haystack: Framework que soporta RAG con múltiples backend retrievers y generadores.
GitHub
LangChain: Facilita la integración de RAG para aplicaciones conversacionales.
GitHub
Pinecone: Base de datos vectorial para indexar y buscar embeddings.
Weaviate: Base de datos para búsquedas semánticas.

2. Modelos preentrenados

DPR (Dense Passage Retrieval): Implementación de Facebook AI.
T5 y BART: Modelos generativos efectivos para tareas de generación de texto.
OpenAI GPT API: Compatible con integración RAG mediante plugins.

3. Datasets

Natural Questions (NQ): Preguntas reales de usuarios con respuestas basadas en documentos.
Google Dataset
SQuAD (Stanford Question Answering Dataset): Dataset clásico para preguntas y respuestas.
MS MARCO: Dataset para recuperación y generación de respuestas a partir de texto.

4. Infraestructura

Bases de datos vectoriales:
- Pinecone, Milvus, Weaviate.
Frameworks de aprendizaje profundo:
- PyTorch, TensorFlow.
API de acceso a modelos:
- OpenAI API, Hugging Face Transformers.

5. Recursos educativos

Cursos:
- Coursera: Natural Language Processing Specialization
Papers:
- "Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks"
Tutoriales:
- Haystack tiene tutoriales en su documentación oficial.
Otros:

What is retrieval augmented generation (RAG) [examples included

Large Action Models (LAMs)

Los Large Action Models (LAMs) son un concepto emergente relacionado con la inteligencia artificial, que amplía las capacidades de los modelos de lenguaje (como GPT) hacia la toma de decisiones y la ejecución de acciones en entornos dinámicos y complejos. Mientras que los modelos de lenguaje generan texto, los LAMs están diseñados para realizar acciones concretas, interactuar con sistemas o ejecutar tareas en el mundo real. Esto los hace ideales para aplicaciones en robótica, sistemas autónomos, juegos, y otras áreas donde la toma de decisiones automatizada es clave.

Características principales de los LAMs

Generación de Acciones: En lugar de producir solo texto, generan comandos o secuencias de acciones ejecutables.
Entrenamiento basado en interacción: Se entrenan en entornos simulados o reales donde pueden experimentar las consecuencias de sus decisiones.
Adaptabilidad: Son capaces de aprender y ajustarse a dinámicas cambiantes en su entorno.
Integración multimodal: Pueden combinar texto, visión, movimiento, y otros datos para realizar tareas complejas.

Ejemplos de LAMs

AlphaGo (DeepMind):
- Desarrollado para jugar al juego de Go.
- Combina aprendizaje profundo y aprendizaje por refuerzo para decidir movimientos en el tablero.
Tesla FSD (Full Self Driving):
- Utiliza modelos para tomar decisiones de manejo en tiempo real, como frenar, girar o cambiar de carril.
Codex (OpenAI):
- Aunque no es un LAM puro, puede considerarse precursor en tareas programáticas, ya que genera código para ejecutar funciones específicas.
ControlNet (para robótica):

Utiliza instrucciones textuales para controlar robots físicos o simulados.

Recursos disponibles para desarrollar LAMs

Desarrollar un LAM requiere herramientas avanzadas y acceso a datos especializados. Aquí tienes una lista de recursos clave:

1. Plataformas de desarrollo

OpenAI Gym / PettingZoo: Entornos para aprendizaje por refuerzo.
Unity ML-Agents: Simulador de entornos 3D interactivos.
MuJoCo: Simulador físico utilizado para entrenar modelos en tareas motoras.

2. Modelos base

Transformers: Modelos como GPT, BERT, y variantes para usar como base.
Reinforcement Learning Algorithms: Algoritmos como DQN, PPO, o A3C.

3. Datasets

D4RL (Datasets for Reinforcement Learning): Conjunto de datos para aprendizaje por refuerzo offline.
Meta-World: Conjunto de entornos simulados para tareas de robótica.
OpenAI CLIP datasets: Para modelos que integran lenguaje y visión.

4. Infraestructura

GPUs y TPUs: Para entrenar modelos grandes.
Frameworks como PyTorch y TensorFlow: Implementación de modelos y entrenamiento.
Cloud Services (AWS, Azure, Google Cloud): Escalabilidad para entrenar modelos.

5. Bibliografía y recursos educativos

Libros:
- "Reinforcement Learning: An Introduction" de Sutton y Barto.
- "Deep Reinforcement Learning Hands-On" de Maxim Lapan.
Cursos:
- "Deep Learning Specialization" en Coursera.
- "CS294: Deep Reinforcement Learning" de UC Berkeley (disponible en YouTube).
Blogs y Papers:
- "Playing Atari with Deep Reinforcement Learning" de DeepMind.
- "Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm" (AlphaZero).
- Large action models (LAMs): The foundation of AI agents

6. Comunidades y foros

Reddit: Subreddits como r/MachineLearning y r/ControlTheory.
GitHub: Repositorios de código abierto para aprendizaje por refuerzo.
Discord y Slack: Comunidades como ML Collective.