ReALM – tabla de contenido
¿Qué es ReALM?
ReALM significa “Resolución de Referencias Como Modelado de Lenguaje”, una solución innovadora desarrollada por investigadores de Apple. Así, es un nuevo modelo de lenguaje (Modelo de Lenguaje Grande, LLM) que trata el problema del reconocimiento de referencias como una tarea en el campo del modelado de lenguaje.
ReALM convierte efectivamente varios tipos de contexto en una representación textual, que luego procesa como parte de una tarea de lenguaje. Esto puede incluir:
- conversaciones – como mensajes de texto, comandos de voz a un asistente o correos electrónicos,
- elementos en la pantalla – por ejemplo, fotos, calendario, widget del clima o aplicaciones y procesos que se ejecutan en segundo plano.
¿Qué hace que ReALM sea diferente de otros modelos de reconocimiento de referencias? Primero, el enfoque – en lugar de depender del procesamiento de imágenes, ReALM opera en el dominio del texto. Esto lo hace mucho más ligero y eficiente, lo que debería permitir que funcione directamente en dispositivos móviles mientras mantiene la privacidad del usuario.
¿En qué aspectos es ReALM mejor que GPT-4?
El equipo de investigación de Apple comparó ReALM con los modelos de lenguaje más poderosos en el mercado hoy en día – GPT-3.5 y GPT-4 de OpenAI. Los resultados fueron impresionantes. En tareas de reconocimiento de referencias, la variante más pequeña de ReALM logró una precisión comparable a GPT-4. ¡Los modelos más grandes de ReALM incluso superaron a GPT-4 en el reconocimiento de referencias a elementos mostrados en la pantalla (http://arxiv.org/abs/2403.20329).
¿Qué explica esta ventaja? Primero, ReALM es excelente con consultas específicas de dominio, como aquellas relacionadas con electrodomésticos inteligentes. Esto se debe a que ReALM demuestra una comprensión más profunda del contexto al ajustar el modelo para datos específicos de dominio.
Además, a diferencia de GPT-4, que se entrena principalmente con imágenes de objetos reales, ReALM sobresale en el reconocimiento de elementos textuales y componentes de interfaces de usuario de aplicaciones. Y es la comprensión de la interfaz lo que es crítico para la interacción fluida de los asistentes de voz con las aplicaciones que usamos hoy en día.

Fuente: DALL·E 3, prompt: Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)
¿Es este el comienzo de la era de asistentes verdaderamente inteligentes?
De hecho, la integración de ReALM con Siri podría abrir un capítulo completamente nuevo en la interacción humano-computadora. Con ReALM, Siri podrá entender comandos que incluyan referencias a elementos mostrados en la pantalla del smartphone, así como procesos y aplicaciones que se ejecutan en segundo plano. Pero, ¿cuándo estará disponible esta opción para los usuarios? Eso aún se desconoce.
Nos queda la especulación basada en las capacidades técnicas del modelo. Entonces, ¿cómo podría funcionar una Siri impulsada por ReALM? Por ejemplo, si estás navegando por un sitio de listados de negocios y ves una empresa que te interesa, podrías simplemente decirle a Siri: “Llama a esta empresa”, y el asistente – utilizando ReALM para analizar el contexto – encontrará el número de teléfono de la empresa que especificas e iniciará la llamada. Ni siquiera tienes que explicar exactamente a qué empresa te refieres.
A esto solo es el comienzo de las posibilidades de ReALM. Comandos como “Reproduce la última lista de reproducción” permitirían un control intuitivo de aplicaciones multimedia y dispositivos de hogar inteligente. ReALM también podría permitir que Siri comprenda el contexto de las conversaciones y el historial de comandos, para que el asistente responda adecuadamente a las solicitudes anteriores del usuario. Este es un paso hacia agentes inteligentes que nos acerca no tanto a una inteligencia artificial que entienda nuestras consultas, sino a una que sepa ejecutar comandos.
Y esto es solo el comienzo de lo que ReALM puede hacer. Comandos como “reproduce la última lista de reproducción” permitirían un control intuitivo de aplicaciones multimedia y dispositivos de hogar inteligente. ReALM también podría permitir que Siri comprenda el contexto de las conversaciones y el historial de comandos, para que el asistente responda adecuadamente a las solicitudes anteriores del usuario. Este es un paso hacia agentes inteligentes, acercándonos no a una inteligencia artificial que entienda nuestras solicitudes, sino a una que sepa cómo ejecutar comandos.
Desafortunadamente, los usuarios de dispositivos Android tendrán que esperar. Actualmente, no hay información sobre los planes de Google para agregar las capacidades de Gemini a Google Assistant. Se ha desarrollado una aplicación de Google Gemini para dispositivos Android (https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en_US), pero aún no está disponible fuera de los Estados Unidos.

Fuente: Google Play (https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en_US)
Resumen
ReALM es el enfoque innovador de Apple para resolver el problema del reconocimiento de contexto por parte de los asistentes de voz. En lugar de depender del procesamiento de imágenes, este modelo de lenguaje convierte diferentes tipos de contexto en una representación textual, que luego procesa en una tarea de lenguaje. Este enfoque asegura no solo una alta precisión de reconocimiento, sino también la capacidad de operar en un dispositivo móvil mientras se mantiene la privacidad del usuario.
Dar acceso a Siri a ReALM puede proporcionar interacciones de voz más naturales y contextuales, un paso importante hacia asistentes verdaderamente inteligentes. Con ReALM, Siri podrá responder instantáneamente a comandos relacionados con elementos de la pantalla, aplicaciones y procesos en segundo plano. Una cosa es cierta: mejorar la conciencia contextual de los asistentes es la clave para crear interacciones de voz verdaderamente inteligentes y naturales, y ReALM es, sin duda, un paso importante en esa dirección.

Si te gusta nuestro contenido, únete a nuestra comunidad de abejas ocupadas en Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.
Robert Whitney
Experto en JavaScript e instructor que capacita a departamentos de TI. Su objetivo principal es aumentar la productividad del equipo enseñando a otros cómo cooperar de manera efectiva mientras programan.
AI in business:
- 6 increíbles complementos de ChatGTP que harán tu vida más fácil
- Navegando nuevas oportunidades de negocio con ChatGPT-4
- 3 increíbles escritores de IA que debes probar hoy
- Actores sintéticos. Los 3 mejores generadores de video de IA
- ¿Cuáles son las debilidades de mi idea de negocio? Una sesión de lluvia de ideas con ChatGPT
- Usando ChatGPT en los negocios
- Nuevos servicios y productos que operan con IA
- Publicaciones automatizadas en redes sociales
- Programación de publicaciones en redes sociales. ¿Cómo puede ayudar la IA?
- El papel de la IA en la toma de decisiones empresariales
- Negocios de PNL hoy y mañana
- Chatbots de texto asistidos por IA
- Aplicaciones de IA en los negocios - visión general
- Amenazas y oportunidades de la IA en los negocios (parte 2)
- Amenazas y oportunidades de la IA en los negocios (parte 1)
- ¿Cuál es el futuro de la IA según el Instituto Global McKinsey?
- Inteligencia artificial en los negocios - Introducción
- ¿Qué es NLP, o procesamiento de lenguaje natural en los negocios?
- Google Translate vs DeepL. 5 aplicaciones de traducción automática para negocios
- Procesamiento automático de documentos
- La operación y las aplicaciones comerciales de los voicebots
- Tecnología de asistentes virtuales, o ¿cómo hablar con la IA?
- ¿Qué es la inteligencia empresarial?
- ¿Cómo puede la inteligencia artificial ayudar con la gestión de procesos de negocio?
- IA creativa de hoy y mañana
- Inteligencia artificial en la gestión de contenidos
- Explorando el poder de la IA en la creación musical
- 3 herramientas útiles de diseño gráfico con IA. IA generativa en los negocios
- IA y redes sociales: ¿qué dicen de nosotros?
- ¿La inteligencia artificial reemplazará a los analistas de negocios?
- Herramientas de IA para el gerente
- El mercado laboral del futuro y las profesiones venideras
- RPA y APIs en una empresa digital
- Nuevas interacciones. ¿Cómo está cambiando la IA la forma en que operamos los dispositivos?
- IA multimodal y sus aplicaciones en los negocios
- Inteligencia artificial y el medio ambiente. 3 soluciones de IA para ayudarte a construir un negocio sostenible.
- Detectores de contenido de IA. ¿Valen la pena?
- ChatGPT vs Bard vs Bing. ¿Cuál chatbot de IA está liderando la carrera?
- ¿Es la IA de chatbot un competidor de la búsqueda de Google?
- Prompts efectivos de ChatGPT para recursos humanos y reclutamiento
- Ingeniería de prompts. ¿Qué hace un ingeniero de prompts?
- IA y ¿qué más? Principales tendencias tecnológicas para negocios en 2024
- IA y ética empresarial. Por qué deberías invertir en soluciones éticas
- Meta AI. ¿Qué deberías saber sobre las funciones soportadas por IA de Facebook e Instagram?
- Regulación de la IA. ¿Qué necesitas saber como emprendedor?
- 5 nuevos usos de la IA en los negocios
- Productos y proyectos de IA: ¿en qué se diferencian de otros?
- IA como un experto en tu equipo
- Equipo de IA vs. división de roles
- ¿Cómo elegir un campo profesional en IA?
- IA en RRHH: Cómo la automatización del reclutamiento afecta a los RRHH y al desarrollo del equipo
- Automatización de procesos asistida por IA. ¿Por dónde empezar?
- 6 herramientas de IA más interesantes en 2023
- ¿Cuál es el análisis de madurez de IA de la empresa?
- IA para la personalización B2B
- Casos de uso de ChatGPT. 18 ejemplos de cómo mejorar tu negocio con ChatGPT en 2024
- Generador de maquetas de IA. Las 4 mejores herramientas
- Microaprendizaje. Una forma rápida de adquirir nuevas habilidades.
- Las implementaciones de IA más interesantes en empresas en 2024
- ¿Qué desafíos presenta el proyecto de IA?
- Las 8 mejores herramientas de IA para negocios en 2024
- IA en CRM. ¿Qué cambia la IA en las herramientas de CRM?
- La Ley de IA de la UE. ¿Cómo regula Europa el uso de la inteligencia artificial?
- Los 7 mejores creadores de sitios web de IA
- Herramientas sin código e innovaciones en IA
- ¿Cuánto aumenta el uso de la IA la productividad de tu equipo?
- ¿Cómo utilizar ChatGTP para la investigación de mercado?
- ¿Cómo ampliar el alcance de tu campaña de marketing con IA?
- IA en transporte y logística
- ¿Qué puntos de dolor empresarial puede solucionar la IA?
- ¿Cómo emparejas una solución de IA con un problema empresarial?
- La inteligencia artificial en los medios
- IA en banca y finanzas. Stripe, Monzo y Grab
- IA en la industria de los viajes
- Cómo la IA está fomentando el nacimiento de nuevas tecnologías
- IA en comercio electrónico. Visión general de los líderes globales
- Las 4 mejores herramientas de creación de imágenes con IA
- Las 5 mejores herramientas de IA para el análisis de datos
- La revolución de la IA en las redes sociales
- ¿Siempre vale la pena agregar inteligencia artificial al proceso de desarrollo de productos?
- 6 mayores errores empresariales causados por la IA
- Estrategia de IA en tu empresa - ¿cómo construirla?
- Mejores cursos de IA – 6 recomendaciones increíbles
- Optimización de la escucha en redes sociales con herramientas de IA
- IoT + IA, o cómo reducir los costos de energía en una empresa
- IA en logística. 5 mejores herramientas
- GPT Store – una visión general de los GPT más interesantes para negocios
- LLM, GPT, RAG... ¿Qué significan las siglas de IA?
- ¿Robots de IA: el futuro o el presente de los negocios?
- ¿Cuál es el costo de implementar la IA en una empresa?
- ¿Qué hacen los especialistas en inteligencia artificial?
- ¿Cómo puede la IA ayudar en la carrera de un freelancer?
- Automatizando el trabajo y aumentando la productividad. Una guía de IA para freelancers
- IA para startups - mejores herramientas
- Construyendo un sitio web con IA
- Once Labs y ¿qué más? Las startups de IA más prometedoras
- OpenAI, Midjourney, Anthropic, Hugging Face. ¿Quién es quién en el mundo de la IA?
- Datos sintéticos y su importancia para el desarrollo de tu negocio
- Motores de búsqueda de IA más destacados. ¿Dónde buscar herramientas de IA?
- Video IA. Los últimos generadores de video de IA.
- IA para gerentes. Cómo la IA puede facilitar tu trabajo
- ¿Qué hay de nuevo en Google Gemini? Todo lo que necesitas saber
- IA en Polonia. Empresas, reuniones y conferencias
- Calendario de IA. ¿Cómo optimizar tu tiempo en una empresa?
- IA y el futuro del trabajo. ¿Cómo preparar su negocio para el cambio?
- Clonación de voz con IA para negocios. ¿Cómo crear mensajes de voz personalizados con IA?
- "Todos somos desarrolladores". ¿Cómo pueden los desarrolladores ciudadanos ayudar a su empresa?
- Verificación de hechos y alucinaciones de IA
- IA en reclutamiento: desarrollando materiales de reclutamiento paso a paso
- Sora. ¿Cómo cambiarán los videos realistas de OpenAI los negocios?
- Midjourney v6. Innovaciones en la generación de imágenes por IA
- IA en las pymes. ¿Cómo pueden las pymes competir con los gigantes utilizando IA?
- ¿Cómo está cambiando la IA el marketing de influencers?
- ¿Es la IA realmente una amenaza para los desarrolladores? Devin y Microsoft AutoDev
- Mejores chatbots de IA para comercio electrónico. Plataformas
- Chatbots de IA para comercio electrónico. Estudios de caso
- ¿Cómo mantenerse al tanto de lo que está sucediendo en el mundo de la IA?
- Domando la IA. ¿Cómo dar los primeros pasos para aplicar la IA en tu negocio?
- ¿Perplejidad, Bing Copilot o You.com? Comparando motores de búsqueda de IA
- Expertos en IA en Polonia
- ReALM. ¿Un modelo de lenguaje innovador de Apple?
- Google Genie — un modelo de IA generativa que crea mundos completamente interactivos a partir de imágenes
- ¿Automatización o aumento? Dos enfoques de la IA en una empresa
- LLMOps, o cómo gestionar eficazmente los modelos de lenguaje en una organización
- Generación de video con IA. Nuevos horizontes en la producción de contenido de video para empresas.
- Mejores herramientas de transcripción de IA. ¿Cómo transformar grabaciones largas en resúmenes concisos?
- Análisis de sentimientos con IA. ¿Cómo ayuda a impulsar el cambio en los negocios?
- El papel de la IA en la moderación de contenido