martes, 14 de enero de 2025

IA para Planificación de Viajes

Ampliamente conocidos y confiables, con una gran base de usuarios y funciones sólidas.


Google Travel: organiza automáticamente toda la información sobre tus reservas de vuelos, hoteles y actividades, generando un itinerario personalizado para tu viaje. Sugiere lugares y actividades basadas en tus preferencias y datos históricos de otros viajeros. Se puede acceder sin conexión a internet.

TripIt: organiza todos los detalles de tu viaje con sólo reenviar tus correos de confirmación. Genera un itinerario con todos los vuelos, hoteles y actividades. Además, te ofrece actualizaciones en tiempo real sobre cualquier cambio o retraso en tu viaje.

Trips by TripAdvisor: la plataforma de viajes TripAdvisor ofrece Trips, un asistente de IA que te facilita la planificación de itinerarios personalizados.

Sygic Travel: ofrece guías de viaje detalladas y crea itinerarios personalizados basados en tus intereses y el tiempo disponible.

Destaca por su singularidad al ofrecer rutas de transporte, complementando perfectamente otras herramientas.


Rome2Rio: proporciona información sobre rutas de transporte entre casi cualquier lugar del mundo, comparando vuelos, trenes, buses, ferries y más. Es ideal para encontrar la mejor manera de desplazarse.

Para planificaciones detalladas y personalizadas.


Travel GPT: asistente de viajes basado en IA que te permite seleccionar tu idioma de preferencia (entre varios, como español, inglés o alemán) y luego buscar destinos. A diferencia de otras herramientas, Travel GPT genera una guía de viaje completa sobre el lugar que planeas visitar, cubriendo aspectos como historia, clima y cultura.

Wonderplan: ingresando tu destino, presupuesto, duración del viaje y con quién viajas, y la IA generará un itinerario completo, detallado por día. Además, la app te muestra el tiempo estimado en cada atracción y te ofrece un desglose de los costos. Es una de las apps con más descargas.

Trip Planner AI: se destaca por ser una aplicación completa que no sólo te ayuda a crear tu itinerario, sino que también te permite reservar vuelos, hoteles y actividades en un solo lugar.

Ask Layla: es una herramienta de IA que actúa como tu agente de viajes personal. Layla te ayuda a encontrar destinos, reservar vuelos y hoteles, y descubrir actividades personalizadas para tu viaje. Está vinculado a Trip Planner AI.

iPlan.AI: diseñada para crear itinerarios personalizados en función de cinco aspectos clave: propósito del viaje, intereses, acompañantes, duración y presupuesto.

GuideGeek: asistente de viajes impulsado por IA que puedes usar directamente desde WhatsApp, Messenger o Instagram. También ofrece recomendaciones personalizadas basadas en tu ubicación y preferencias.

Trip Notes / Dorsia: asistente de IA que te proporciona recomendaciones basadas en tus preferencias de viaje. Ya sea que busques un buen lugar para brunch o los mejores puntos turísticos para un fin de semana, esta app te ofrece un mapa interactivo con descripciones detalladas de cada lugar, ayudándote a descubrir rincones únicos durante tu viaje.

Vacay Chatbot: asistente virtual que sugiere recomendaciones personalizadas de lugares y actividades, y te ayuda a crear un itinerario completo, desde el vuelo hasta las actividades diarias. Cuenta con asistentes virtuales especializados en diferentes tipos de viajeros, como familias, viajeros de lujo o quienes buscan gemas ocultas en el destino.

Wanderboat: ayuda a planificar tu viaje con un asistente de IA que destaca en la búsqueda rápida de actividades, restaurantes y rutas personalizadas.

Roam Around: una app simple pero efectiva que utiliza la IA de ChatGPT para ayudarte a planificar viajes detallados.

Roadtrippers: ideal para los viajes por carretera. Sugiere las mejores rutas y paradas a lo largo del camino, destacando atracciones, restaurantes y alojamientos.

Automatización y Agentes de IA

Los agentes de IA son programas autónomos diseñados para interactuar con entornos y tomar decisiones basadas en datos y aprendizaje.

En procesos de automatización, estos agentes permiten ir más allá de las reglas fijas, incorporando capacidades como el aprendizaje, la adaptabilidad y la toma de decisiones en tiempo real.

Por ejemplo, en un sistema de atención al cliente automatizado, un agente de IA (como un chatbot) no solo responde preguntas preprogramadas, sino que aprende de las interacciones para ofrecer respuestas más personalizadas.


Usos de la automatización basada en agentes de IA


Atención al cliente: Agentes conversacionales y chatbots que responden consultas en tiempo real.

Procesamiento de documentos: Sistemas que leen y clasifican documentos, como contratos o facturas, utilizando procesamiento de lenguaje natural.

Gestión de la cadena de suministro: Agentes que predicen la demanda y optimizan inventarios.

Automatización industrial: Robots que aprenden a realizar tareas más eficientemente en entornos dinámicos.


Servicios pagos en la nube

Se utilizan para automatizar flujos de trabajo e integrar aplicaciones.
  • ZapierIdeal para usuarios no técnicos que necesitan automatizaciones simples y rápidas. Fácil de usar y buen soporte. Menos flexible para flujos complejos. Limitado para manipulación avanzada de datos. Ideal para casos simples como enviar un correo tras recibir un formulario.
  • Make: plataforma visual, flexible y escalable para automatizar tareas y workflows. Orientado a usuarios con cierta experiencia técnica que buscan más flexibilidad. Integraciones con muchas APIs y capacidad para personalizaciones avanzadas. Curva de aprendizaje más pronunciada. Menos integraciones predefinidas comparado con Zapier. Automatizaciones complejas que requieren lógica condicional o transformaciones avanzadas de datos.
  • Microsoft Power Automate: Diseñado para empresas que ya usan el ecosistema Microsoft 365 y necesitan integración profunda con estas herramientas. Compatible con aplicaciones de Microsoft (Excel, Teams, SharePoint, etc.). Soporte para RPA (Automatización Robótica de Procesos) para tareas repetitivas en sistemas antiguos. Integraciones con apps externas limitadas en comparación con Zapier o Make. Ideal para automatizaciones empresariales dentro del ecosistema de Microsoft.
  • IBM webMethods: suite de herramientas enfocadas en la integración empresarial, automatización de procesos, administración de APIs y manejo de datos en tiempo real. Está diseñada para ayudar a las empresas a conectar sistemas, aplicaciones y datos a través de entornos on-premise, en la nube y en configuraciones híbridas (iPaaS).

Plataformas de código abierto

  • N8N: plataforma de código abierto para automatización de flujos de trabajo que permite conectar aplicaciones y servicios para realizar tareas repetitivas de forma automática. También hay un servisio n8n SaaS para ser utilizado en la nube.

lunes, 13 de enero de 2025

IA aplicada a la Construcción

 La inteligencia artificial (IA) está revolucionando la industria de la construcción, especialmente en áreas como saneamiento, obras hidráulicas, infraestructura vial, túneles, puertos, dragados, tratamientos costeros, arquitectura y energía. 


Análisis predictivo para la toma de decisiones

La inteligencia artificial trasciende el análisis convencional, anticipando necesidades y riesgos en tiempo real.

Previsión de sobrecostos en proyectos: Las redes neuronales permiten utilizar datos de proyectos anteriores, a fin de establecer modelos predictivos en futuros proyectos, mediante el análisis de los diferentes procesos de la construcción y el establecimiento de hitos claves.

Optimización de diseños: BIM (Building Information Model) es un modelo único que integra los diferentes planos, incluyendo la información estructural, arquitectónica y de instalaciones. Los diferentes agentes implicados en la construcción, deben volcar toda su información a este modelo único, a fin de mediante la utilización de algoritmos de aprendizaje automático, poder predecir posibles conflictos, minimizar sus efectos y generar alternativas válidas.

Gestión de Riesgos y Mitigación de accidentes: La construcción es el sector económico que mayor tasa de accidentabilidad presenta. La inteligencia artificial se está utilizando para realizar una monitorización y evaluación continua del espacio de construcción, y así evitar y mitigar los posibles riesgos.

Optimización de recursos: Se mejora la asignación de maquinaria y personal, anticipando y resolviendo conflictos de programación.

Monitoreo y Mantenimiento preventivo: Se pronostica el desgaste de equipo, programando mantenimientos antes de que se presenten averías.

Sostenibilidad y Eficiencia Energética: Los diseños generados con el apoyo de IA pueden analizar el ciclo de vida, permitiendo crear estructuras que sean energéticamente eficientes, proponiendo esquemas de uso eficiente y sostenible.
CarbonCure Technologies incorpora IA para optimizar los diseños de mezclas de hormigón que secuestran dióxido de carbono durante el proceso de curado. Analizando los datos de los productores de hormigón y las condiciones ambientales, la plataforma de IA de CarbonCure ajusta las proporciones de las mezclas para mejorar la sostenibilidad sin comprometer la integridad estructural.

Control de mano de obra: Las empresas de construcción están también utilizando el aprendizaje automático para planificar mejor la distribución de mano de obra y maquinaria en los puestos de trabajo. Un robot evalúa constantemente el progreso del trabajo y la ubicación de cada uno de los operarios y equipos. Con esta información, una red neuronal decide cual es el lugar óptimo de cada trabajador en cada una de las fases de la construcción.


Drones y AI en la supervisión de proyectos

Con la implementación de drones equipados con inteligencia artificial, las inspecciones de obras se tornan más eficientes y seguras. Los drones pueden capturar datos visuales de áreas de difícil acceso, reduciendo riesgos laborales y optimizando el tiempo de supervisión.
La integración de imágenes y datos en tiempo real mejora la toma de decisiones. Al incluir algoritmos de aprendizaje profundo, los drones interpretan datos visuales para identificar anomalías constructivas y verificar el cumplimiento de las especificaciones técnicas.
La empresa Firmatek, especializada en la recopilación de datos mediante drones, utiliza algoritmos de IA para procesar imágenes aéreas y datos LiDAR para realizar levantamientos topográficos y cálculos volumétricos precisos.


Robots AI en tareas de construcción autónoma

La integración de robots AI en la construcción autónoma promete una revolución en la eficiencia y precisión de las tareas.

Automatización de procesos constructivos: Implementación de robots capaces de ejecutar tareas repetitivas con alta precisión.
Supervisión y corrección autónoma: Sistemas AI que monitorean constantemente el progreso y ajustan las operaciones en tiempo real.
Logística optimizada: Robots AI encargados de la gestión y transporte de materiales en la obra.
Colaboración humano-robot: Desarrollo de sistemas que permiten la interacción segura y efectiva entre trabajadores y robots.

BIM (Building Information Modeling)

El Building Information Modeling (BIM) es un método de gestión colaborativa de construcciones que combina datos e información en un modelo 3D. Permite generar un modelo de la construcción que contiene información sobre todo el ciclo de vida de la obra, desde el diseño hasta la construcción, y hasta su demolición y desmantelamiento.
Además de una representación tridimensional, con el BIM es posible crear un modelo informativo dinámico, interdisciplinario y compartido que contiene datos sobre geometría, materiales, estructura portante, características térmicas y rendimiento energético, instalaciones, costos, seguridad y mantenimiento.
Para lograr esto, BIM integra a todos los agentes que intervienen en el proceso, ya sean arquitectos, ingenieros, constructores, propietarios, especialistas, etc. Esto facilita la colaboración y comunicación entre las partes, ya que se trabaja desde un único modelo con información basada en datos reales.
La metodología BIM centraliza toda la información del proyecto en un único modelo de información creado por todos los agentes participantes. Incluso puede incluir los productos necesarios para materializar la obra, incorporando al modelo sus características, costo e información de contacto para comprarlos.


jueves, 9 de enero de 2025

Análisis de Textos

Las siguientes son herramientas y frameworks que estamos analizando, orientados al anlálisis de textos y extracción de entidades.

On Premise

SpaCy

Una de las bibliotecas más populares para procesamiento de lenguaje natural. Tiene soporte para modelos preentrenados en español.

  • Reconocimiento de entidades nombradas (NER).
  • Posibilidad de entrenar modelos para textos legales.
Se puede integrar en C# utilizando el servicio Python REST API con Flask o FastAPI y realizando llamadas HTTP desde la aplicación.


Hugging Face Transformers

Plataforma para utilizar modelos como BERT y RoBERTa, con soporte en español y entrenados para tareas como NER.

  • Modelos como BETO o mBERT entrenados para textos en español.
  • Alta precisión para dominios especializados (como demandas legales).

Se puede crear un servicio REST API en Python o Node.js y luego llamarlo desde C#.


Stanford NLP

Biblioteca potente para análisis sintáctico y semántico, con soporte multilenguaje (incluido español).
  • Reconocimiento de entidades nombradas (NER).
  • Compatibilidad con textos largos y complejos.
Se puede implementar el servidor CoreNLP y realizar solicitudes HTTP desde una aplicación C#.



Servicios en la nube

Google Cloud Natural Language API

  • Extracción de entidades.
  • Análisis de sintaxis y sentimientos.

AWS Comprehend

  • Reconocimiento de entidades personalizadas (Custom Entity Recognition).
  • Entrenamiento con conjuntos de datos legales.

Azure Cognitive Services - Text Analytics

  • Reconocimiento de entidades estándar y personalizadas.
  • Escalabilidad e integración nativa con el ecosistema Azure.


Frameworks Open Source con Modelos Personalizables

NERD (Named Entity Recognition Dashboard)

Framework para desarrollar modelos personalizados de extracción de entidades.
  • Basado en herramientas como SpaCy o Hugging Face.
  • Útil para etiquetar textos y entrenar modelos adaptados.

Doccano

Herramienta de etiquetado para entrenar modelos personalizados de NLP.
  • Útil para generar datasets y entrenar herramientas como SpaCy o Transformers.

Prodigy

Herramienta de etiquetado para entrenar modelos personalizados de NLP.
  • Útil para generar datasets y entrenar herramientas como SpaCy.
  • Costo $390 lifetime x site (Personal).

Herramientas Especializadas en el Dominio Legal

Soluciones preconstruidas de LegalTech.

ROSS Intelligence

Plataforma diseñada para documentos legales, incluyendo análisis de contratos y demandas.

Legal Robot

Ofrece soluciones para procesar documentos legales y extraer datos clave.


jueves, 2 de enero de 2025

Retrieval Augmented Generation (RAG)

RAG es un enfoque en el campo de la inteligencia artificial que combina modelos de recuperación de información con modelos generativos de lenguaje para mejorar la precisión y la relevancia de las respuestas generadas. Este enfoque permite que los modelos generativos accedan a información externa en tiempo real, lo que es útil para manejar tareas que requieren datos actualizados o específicos, como responder preguntas basadas en documentos o ejecutar búsquedas dinámicas.





¿Cómo funciona RAG?

  1. Componente de Recuperación (Retriever):

    • Identifica información relevante a partir de una base de datos, corpus de texto, o fuente externa.
    • Métodos comunes:
      • Sistemas tradicionales: TF-IDF, BM25.
      • Modelos de embeddings: Dense retrievers como DPR (Dense Passage Retrieval) que utilizan vectores para comparar similitudes semánticas.
  2. Componente Generativo (Generator):

    • Toma los documentos recuperados y genera una respuesta basada en la información contenida en ellos.
    • Modelos típicos: GPT, T5, o BART.
  3. Pipeline completo:

    • Dado un input (como una pregunta), el retriever busca información relevante, y el generator usa esta información para crear una respuesta natural y contextual.


Ejemplos de uso de RAG

  1. Chatbots empresariales:

    • Responden preguntas específicas sobre documentos de política interna, bases de conocimiento o contratos legales.
    • Ejemplo: Un chatbot que accede a manuales de empleados para responder preguntas sobre beneficios.
  2. Sistemas de búsqueda mejorados:

    • Motores de búsqueda que combinan la recuperación con respuestas explicativas.
    • Ejemplo: Un motor de búsqueda académico que genera un resumen de los papers relevantes.
  3. Asistentes de soporte técnico:

    • Generan instrucciones personalizadas basadas en guías técnicas.
    • Ejemplo: Un asistente que ayuda a resolver problemas técnicos con base en manuales de productos.
  4. Generación de contenido personalizado:

    • Utilizado para redactar informes o resúmenes basados en datos recopilados.
    • Ejemplo: Herramientas que generan reportes financieros combinando datos recientes.


Ejemplos de modelos RAG existentes

  1. Dense Passage Retrieval (DPR):

    • Combina embeddings densos con modelos generativos.
    • Ejemplo de uso: Enriquecer respuestas en asistentes virtuales.
  2. Google Bard y OpenAI ChatGPT con Plugins:

    • Usan fuentes externas en tiempo real para recuperar información y generar respuestas.
  3. RAG Framework (Meta AI):

    • Combina retrieval y generación utilizando modelos como BART para respuestas basadas en contexto.
  4. Haystack (de deepset):

    • Framework modular de código abierto para implementar sistemas de preguntas y respuestas basados en RAG.


Recursos para desarrollar un sistema RAG

    1. Bibliotecas y herramientas
  • Haystack: Framework que soporta RAG con múltiples backend retrievers y generadores.
    GitHub
  • LangChain: Facilita la integración de RAG para aplicaciones conversacionales.
    GitHub
  • Pinecone: Base de datos vectorial para indexar y buscar embeddings.
  • Weaviate: Base de datos para búsquedas semánticas.
    2. Modelos preentrenados
  • DPR (Dense Passage Retrieval): Implementación de Facebook AI.
  • T5 y BART: Modelos generativos efectivos para tareas de generación de texto.
  • OpenAI GPT API: Compatible con integración RAG mediante plugins.
    3. Datasets
  • Natural Questions (NQ): Preguntas reales de usuarios con respuestas basadas en documentos.
    Google Dataset
  • SQuAD (Stanford Question Answering Dataset): Dataset clásico para preguntas y respuestas.
  • MS MARCO: Dataset para recuperación y generación de respuestas a partir de texto.
    4. Infraestructura
  • Bases de datos vectoriales:
    • Pinecone, Milvus, Weaviate.
  • Frameworks de aprendizaje profundo:
    • PyTorch, TensorFlow.
  • API de acceso a modelos:
    • OpenAI API, Hugging Face Transformers.
    5. Recursos educativos



Large Action Models (LAMs)

Los Large Action Models (LAMs) son un concepto emergente relacionado con la inteligencia artificial, que amplía las capacidades de los modelos de lenguaje (como GPT) hacia la toma de decisiones y la ejecución de acciones en entornos dinámicos y complejos. Mientras que los modelos de lenguaje generan texto, los LAMs están diseñados para realizar acciones concretas, interactuar con sistemas o ejecutar tareas en el mundo real. Esto los hace ideales para aplicaciones en robótica, sistemas autónomos, juegos, y otras áreas donde la toma de decisiones automatizada es clave.


Características principales de los LAMs

  1. Generación de Acciones: En lugar de producir solo texto, generan comandos o secuencias de acciones ejecutables.
  2. Entrenamiento basado en interacción: Se entrenan en entornos simulados o reales donde pueden experimentar las consecuencias de sus decisiones.
  3. Adaptabilidad: Son capaces de aprender y ajustarse a dinámicas cambiantes en su entorno.
  4. Integración multimodal: Pueden combinar texto, visión, movimiento, y otros datos para realizar tareas complejas.

Ejemplos de LAMs

  1. AlphaGo (DeepMind):
    • Desarrollado para jugar al juego de Go.
    • Combina aprendizaje profundo y aprendizaje por refuerzo para decidir movimientos en el tablero.
  2. Tesla FSD (Full Self Driving):
    • Utiliza modelos para tomar decisiones de manejo en tiempo real, como frenar, girar o cambiar de carril.
  3. Codex (OpenAI):
    • Aunque no es un LAM puro, puede considerarse precursor en tareas programáticas, ya que genera código para ejecutar funciones específicas.
  4. ControlNet (para robótica):
    • Utiliza instrucciones textuales para controlar robots físicos o simulados.

Recursos disponibles para desarrollar LAMs

Desarrollar un LAM requiere herramientas avanzadas y acceso a datos especializados. Aquí tienes una lista de recursos clave:

1. Plataformas de desarrollo
  • OpenAI Gym / PettingZoo: Entornos para aprendizaje por refuerzo.
  • Unity ML-Agents: Simulador de entornos 3D interactivos.
  • MuJoCo: Simulador físico utilizado para entrenar modelos en tareas motoras.
2. Modelos base
  • Transformers: Modelos como GPT, BERT, y variantes para usar como base.
  • Reinforcement Learning Algorithms: Algoritmos como DQN, PPO, o A3C.
3. Datasets
  • D4RL (Datasets for Reinforcement Learning): Conjunto de datos para aprendizaje por refuerzo offline.
  • Meta-World: Conjunto de entornos simulados para tareas de robótica.
  • OpenAI CLIP datasets: Para modelos que integran lenguaje y visión.
4. Infraestructura
  • GPUs y TPUs: Para entrenar modelos grandes.
  • Frameworks como PyTorch y TensorFlow: Implementación de modelos y entrenamiento.
  • Cloud Services (AWS, Azure, Google Cloud): Escalabilidad para entrenar modelos.
5. Bibliografía y recursos educativos
  • Libros:
    • "Reinforcement Learning: An Introduction" de Sutton y Barto.
    • "Deep Reinforcement Learning Hands-On" de Maxim Lapan.
  • Cursos:
    • "Deep Learning Specialization" en Coursera.
    • "CS294: Deep Reinforcement Learning" de UC Berkeley (disponible en YouTube).
  • Blogs y Papers:
6. Comunidades y foros
  • Reddit: Subreddits como r/MachineLearning y r/ControlTheory.
  • GitHub: Repositorios de código abierto para aprendizaje por refuerzo.
  • Discord y Slack: Comunidades como ML Collective.

Asistentes y Aplicaciones IA (Varios)

A continuación mencionamos las aplicacioens de IA más conocidas hasta el momento. 

NOTA: a medida que avanzamos en el análisis de cada categoría es posible que generemos una entrada nueva en el blog, específica para esa categoría. Es el caso de:

Automatización y Agentes de IA
IA para Planificación de Viajes
IA aplicada a la Construcción


Asistentes Personales y Compañeros Digitales

Suelen responder preguntas, administrar calendarios, controlar dispositivos inteligentes. 

Las más conocidas son las que vienen incorporadas en los celulares y sistemas operativos:

  • Siri
  • Alexa
  • Google Assistant
Compañeros digitales más avanzados son:
  • Character.AI: Diseña compañeros virtuales. Ideal para entretenimiento y simulaciones específicas.
  • Replika: permite generar un Avatar, un amigo virtual que ayuda con apoyo emocional y social. Ofrece conversaciones relajadas, ejercicios de bienestar, y escucha activa.
  • Woebot: Terapeuta virtual basado en IA para mejorar la salud mental.

Suplantación de Identidad

Deepfakes (video e imágenes): crear videos falsos en los que alguien parece decir o hacer algo que nunca ocurrió.
Voice Synthesis: replicar patrones vocales a partir de grabaciones existentes.
Text Spoofing: imitar el estilo de escritura de una persona.
Image Spoofing: manipular o crear de imágenes realistas con IA.

Herramientas para clonarte en video:
  • Synthesia: Permite crear un avatar digital a partir de tu imagen y voz para generar videos con texto como entrada.
  • Avatarify: Software de código abierto que te permite controlar un avatar en tiempo real usando tus expresiones faciales.
  • DeepBrain AI: Crea un avatar hiperrealista a partir de un video tuyo, que luego puedes usar para generar contenido con texto o guiones.
  • HeyGen (antes Movio): Permite crear videos con avatares personalizados que incluyen movimientos faciales y sincronización de labios.
  • D-ID: Ofrece la posibilidad de crear videos a partir de una foto estática de ti mismo combinada con texto o audio.


Herramientas para clonarte tu voz:

  • ElevenLabs: Clona tu voz con alta precisión para generar audios personalizados.
  • Respeecher: Genera una clonación perfecta de tu voz para contenido creativo.


    Chatbots

    Inicialmente surgieron para brindar servicios de atención al cliente:
    • Zendesk Chat
    • Intercom
    • Drift

    Frameworks para armar chatbots más personalizados:
  • Rasa: Open-source y personalizable.
  • Microsoft Bot Framework: Para integrar con Azure y otras plataformas.
  • Dialogflow: Plataforma de Google Cloud para crear chatbots basados en IA.
  •  

    Modelos de LLM :

    • Modelos de OpenAI (GPT-4, GPT-3.5, etc.): Disponibles a través de APIs comerciales.
    • Hugging Face Transformers: Modelos open-source como BERT, GPT-Neo, LLaMA o Falcon que puedes entrenar o afinar localmente.
    • Google Vertex AI: Ofrece acceso a modelos de PaLM y otros.
    • Azure OpenAI Service: Acceso a modelos de OpenAI con integración empresarial.
    • Anthropic Claude: Otra opción para modelos de lenguaje avanzados.

    Para estructurar datos:
    • Pipelines ETL: Extraer, transformar y cargar datos (Apache Spark, Pandas).
    • Herramientas de indexación: para convertir los datos en un formato accesible.
      • LangChain: Para conectar datos y LLMs de manera estructurada.
      • Haystack: Framework para construir pipelines de NLP basados en búsqueda.
      • Pinecone, Weaviate, o Milvus: Bases de datos vectoriales para búsquedas semánticas.

    Procesamiento de Lenguaje Natural (NLP)

    Análisis de texto, generación de contenido, corrección gramatical.
    • Grammarly
    • Jasper
    • Copy.ai

    Análisis de Datos e Inteligencia de Negocios

    Visualización de datos, generación de reportes, consultas en lenguaje natural.
    • Tableau con Ask Data
    • ThoughtSpot.

    Educación y Aprendizaje

    Personalización del aprendizaje, generación de ejercicios, retroalimentación.
    • Duolingo
    • Khan Academy con AI
    • Quizlet

    Creación de Imágenes

    Crear ilustraciones, gráficos, renders, o imágenes a partir de texto.
    • DALL·E
    • MidJourney
    • Stable Diffusion
    • ChatGPT Plus (se conecta con DALL-E): Puedes describir con palabras lo que necesitas y DALL·E creará una imagen basada en esa descripción.

    Creación de Audio

    Composición de música, creación de narraciones, síntesis de voz.
    • Descript
    • AIVA
    • Murf.ai.

    Generación de Textos

    Escritura de artículos, copywriting, generación de diálogos o guiones, traducciones.
    • ChatGPT
    • Jasper
    • Copy.ai

    Generación de Video


    Edición de video asistida, creación de videos a partir de texto, deepfake.
    • Runway
    • Synthesia
    • Pictory

    Generación de Modelos 3D

    Creación de modelos 3D a partir de imágenes o descripciones.

    • NVIDIA Omniverse
    • Kaedim

    Edición y Mejora Creativa

    Mejora automática de fotos, sugerencias de diseño, ajustes asistidos.
    • Canva con Magic Write
    • Adobe Sensei.

    Generación Multimodal (Texto a Imagen, Audio, Video, etc.)

    Transformar texto en múltiples formatos creativos como imágenes, videos o audios.

    • Runway Gen-2
    • Hugging Face (text-to-image models)

    Analizar Videos y Resumir Ideas

    • Otter.ai: Transcribe automáticamente el audio de un video y utiliza NLP para generar resúmenes de las ideas principales. Ideal para reuniones o conferencias. Compatible con Zoom, Google Meet y videos subidos directamente.
    • Derscript: Transcripción automática y edición basada en texto; permite identificar ideas clave y eliminar fragmentos irrelevantes. Integra edición de video y herramientas de resumen.
    • Trint: Transcribe videos y genera resúmenes o puntos clave. También permite la edición colaborativa del contenido transcrito. Muy útil para periodistas y creadores de contenido.
    • Wisecut: Transcribe y genera resúmenes automáticos de videos largos, eliminando silencios y pausas. Fácil de usar, especialmente para ediciones rápidas.
    • Rephrase.ai: Utiliza inteligencia artificial para resumir ideas clave de videos. También puede convertir texto en videos personalizados. Compatible con varios idiomas y plataformas.
    • Video Insights de IBM Watson Media:  Extrae automáticamente resúmenes e ideas clave de contenido de video mediante análisis de lenguaje y reconocimiento de imágenes. Potente herramienta empresarial con análisis avanzado.
    • InVideo: Transcribe audio de video y permite resaltar y extraer puntos clave. Incluye opciones de edición adicional y mejora visual.
    • Microsoft Stream: Genera transcripciones automáticas de videos y permite buscar palabras clave dentro del contenido transcrito. Integrado en la suite de Microsoft 365, útil para uso corporativo.

    Aplicaciones de Salud

    Diagnósticos iniciales, terapia conversacional, seguimiento de salud.
    • Ada Health
    • Woebot
    • Babylon Health

    Gaming e IA Narrativa
    Generación de historias, personajes interactivos.
    • AI Dungeon
    • Replica.

    Gestión y Productividad

    Resúmenes automáticos, toma de notas, planificación.
    • Notion AI
    • Otter.ai: Transcribe automáticamente el audio de un video y utiliza NLP para generar resúmenes de las ideas principales. Ideal para reuniones o conferencias.

    E-commerce y Recomendaciones

    Personalización de productos, chatbots para ventas.
    • Shopify con AI
    • Amazon Personalize

    Otras Aplicaciones

    En esta categoría entran algunas Apps recomendadas fuera de serie.

    • Simple Sing: My Singing App - Adapta cualquier cansión a tu tono de voz para poder cantarla sin problemas.

    Plataformas

    Estas son las plataformas más conocidas que ofrecen generación de imágenes mediante inteligencia artificial, organizadas por su popularidad y enfoque:

    MidJourney
    • Descripción: Plataforma muy reconocida por su capacidad para crear imágenes artísticas y visualmente impresionantes a partir de texto.
    • Acceso: Funciona principalmente a través de Discord.
    • Usos Destacados: Arte conceptual, diseño gráfico, creación de portadas de libros.
    DALL·E 2 (de OpenAI)
    • Descripción: Creado por OpenAI, genera imágenes detalladas a partir de texto y permite edición en las imágenes generadas.
    • Acceso: Directamente desde OpenAI o a través de la integración con ChatGPT Plus.
    • Usos Destacados: Imágenes conceptuales, ilustraciones personalizadas.
    Stable Diffusion
    • Descripción: Una plataforma de código abierto para generación de imágenes, que permite personalizaciones avanzadas.
    • Acceso: A través de interfaces como DreamStudio, Automatic1111 o aplicaciones independientes.
    • Usos Destacados: Creación de imágenes únicas, diseño técnico, experimentación.
    Runway ML
    • Descripción: Plataforma multimodal que no solo genera imágenes, sino también videos, permitiendo edición y creación avanzada.
    • Acceso: Basado en navegador; ideal para creadores multimedia.
    • Usos Destacados: Generación de videos, prototipos creativos, efectos visuales.
    Artbreeder
    • Descripción: Especializado en modificar y generar retratos o imágenes estilizadas mediante IA.
    • Acceso: Plataforma en línea con herramientas simples para usuarios principiantes.
    • Usos Destacados: Diseño de personajes, retratos, arte conceptual.
    DeepAI
    • Descripción: Proporciona herramientas básicas para la generación de imágenes, enfocándose en simplicidad y resultados rápidos.
    • Acceso: Basado en navegador; ideal para uso casual.
    • Usos Destacados: Generación rápida de conceptos, bocetos básicos.
    NightCafe Studio
    • Descripción: Enfocado en la creación de obras de arte mediante diferentes algoritmos de IA.
    • Acceso: Plataforma en línea con opciones gratuitas y de pago.
    • Usos Destacados: Arte digital, murales, diseño decorativo.
    Fotor (AI Art Generator)
    • Descripción: Herramienta simple y amigable para usuarios no técnicos, con un enfoque en diseño y marketing.
    • Acceso: En línea y como app móvil.
    • Usos Destacados: Publicidad, diseño gráfico rápido.
    Craiyon (antes DALL·E Mini)
    • Descripción: Versión simplificada de DALL·E, accesible y gratuita, aunque con resultados más básicos.
    • Acceso: Basado en navegador.
    • Usos Destacados: Experimentación casual.

    Factores para Elegir una Plataforma

    • Calidad de las imágenes: MidJourney y DALL·E destacan por su realismo y creatividad.
    • Facilidad de uso: NightCafe y Fotor son ideales para principiantes.
    • Costo: Stable Diffusion (gratuito en local) y Craiyon son opciones económicas.
    • Flexibilidad: Stable Diffusion y Runway ML son muy personalizables.