El asistente de voz de Apple, Siri, está a punto de recibir una actualización significativa con la incorporación de inteligencia artificial (IA). Aunque originalmente se esperaba que estas mejoras debutaran junto con la actualización de Apple Intelligence en el segundo semestre de este año, el lanzamiento se ha pospuesto para el segundo trimestre de 2025.

Según Mark Gurman de Bloomberg, Apple ha decidido retrasar el lanzamiento para asegurar la calidad y el rendimiento de las nuevas funciones. Los usuarios podrán aprovechar estas mejoras en dispositivos iPhone, iPad y Mac una vez estén disponibles.

versión de Siri con inteligencia artificial

La nueva versión de Siri fue anunciada a mediados de junio, durante un evento en el que se confirmó que la actualización se implementará en iOS 18, iPadOS 18 y macOS Sequoia. Inicialmente, se esperaba que Siri con IA estuviera disponible junto con el lanzamiento del iPhone 16.

Avances en Siri con inteligencia artificial

La integración de Apple Intelligence permitirá que Siri entienda y responda de manera más precisa y coherente. Las conversaciones con el asistente serán más fluidas y permitirá la interacción tanto por escrito como por voz. Sin embargo, estas mejoras estarán disponibles solo en los modelos iPhone 15 Pro, iPhone 15 Pro Max, y dispositivos iPad y Mac con el chip M1 o posterior.

Aunque se anticipaba que las nuevas capacidades de Siri estarían listas para el lanzamiento de Apple Intelligence a finales de este año, ahora se planea que las pruebas beta para desarrolladores comiencen en enero de 2025. El lanzamiento oficial para el público general se espera entre marzo y mayo de 2025, coincidiendo con la actualización del sistema operativo iOS 18.4.

Características y funcionalidades mejoradas

El retraso se debe a la complejidad de las nuevas funciones y a la necesidad de garantizar un rendimiento óptimo. Entre las mejoras más destacadas, Siri tendrá un control más preciso sobre las aplicaciones de Apple. Por ejemplo, los usuarios podrán pedir al asistente que edite una foto y la envíe a un amigo, o que programe correos electrónicos en la aplicación Mail. Siri también entenderá mejor el contexto de lo que se muestra en la pantalla, facilitando interacciones más inteligentes y contextuales.

Apple Intelligence permitirá que Siri realice una amplia gama de nuevas acciones tanto en aplicaciones de Apple como de terceros, adaptándose a la información del dispositivo y las preferencias del usuario. Estas mejoras harán que Siri sea una herramienta más versátil y accesible para realizar tareas que antes no eran posibles. Además, la integración con ChatGPT, desarrollada por OpenAI, se espera para finales de 2024, antes del lanzamiento completo de las demás funcionalidades.

Innovaciones en otros productos de Apple

Apple también está trabajando en mejoras para otros productos, como los AirPods equipados con cámaras. Este proyecto, conocido internamente como B798, pretende utilizar cámaras con inteligencia artificial para proporcionar información contextual al usuario.

La famosa tienda de juguetes Toys “R” Us ha lanzado un anuncio en video que ha provocado tanto elogios como críticas. El video, de un minuto de duración, fue creado casi en su totalidad con la herramienta Sora de OpenAI, que convierte texto en video y aún no está disponible para el público general.

El anuncio, titulado “El origen de Toys ‘R’ Us”, presenta al fundador de la compañía, Charles Lazarus, de niño y su mascota, Geoffrey la Jirafa. Este video fue presentado en el Festival de Cine de Cannes, generando miles de reacciones en las redes sociales.

El nuevo anuncio realizado con la herramienta Sora de OpenAI

Reacciones del público

Las respuestas han sido variadas. Algunos profesionales creativos lo han calificado como “brillante” y “emocionante”, mientras que otros lo han descrito como “una abismal ofensa” que “debería aterrorizar”. Kim Miller Olko, directora de marketing de Toys “R” Us y presidenta de Toys “R” Us Studios, describió la creación del anuncio como una oportunidad para experimentar con tecnología de vanguardia: “El tren salió de la estación y decidimos ser los primeros en subirnos”.

Chris Beresford-Hill, director creativo global de la agencia BBDO, mencionó que muchas reacciones se debieron a temores sobre el potencial de la inteligencia artificial para afectar la calidad y el empleo en la industria del marketing. “El mundo está lleno de anuncios como este, y creo que no son muy buenos”, dijo Beresford-Hill al WSJ. “Este anuncio nunca sería discutido por nadie si no fuera por la IA”.

Proceso de creación del anuncio

El proceso de creación del video no fue simplemente presionar un botón, según Nik Kleverov, director creativo de la agencia y productora Native Foreign. Aproximadamente 20 personas de su equipo, incluyendo diseñadores, directores de arte y animadores, trabajaron en conjunto para generar cada toma, proporcionando a Sora varios párrafos de instrucciones. Kleverov explicó que la herramienta a menudo malinterpretaba las intenciones de los escritores, lo que a veces requería cientos de revisiones del texto.

Una dificultad particular fue instruir a la IA sobre las motivaciones de los personajes para lograr las expresiones faciales y movimientos adecuados. Según Kleverov, Sora completó entre el 80% y 85% del trabajo, antes de que el equipo realizara pequeñas correcciones a las imágenes, similar a cómo se ajustan colores o se eliminan manchas en la postproducción tradicional.

Resultado final y recepción

El resultado final contiene numerosas imperfecciones, algo que los críticos en línea señalaron rápidamente. Por ejemplo, la estrella virtual del anuncio no se parece al mismo niño en cada toma. Sin embargo, Mark D’Arcy, exdirector creativo y vicepresidente de marketing global de negocios en Meta Platforms, defendió la valentía de Toys “R” Us al lanzar el anuncio: “Yo diría que es mediocre y que es impresionante en la forma en que fue creado, y que es tan bueno como la mayoría de la publicidad que se hace estas semanas en el mundo”.

Miller Olko destacó que la creación del anuncio requirió menos presupuesto, tiempo y personal de lo que hubiera sido necesario sin la inteligencia artificial, cumpliendo uno de los principales atractivos de esta tecnología. Este proyecto plantea un desafío para las agencias que tradicionalmente facturan a los clientes por hora y por la cantidad de personas que trabajan en un proyecto. Kleverov señaló que todavía están intentando descubrir cómo cobrar por este tipo de trabajo, ya que “no es la típica línea de producción”.

El anuncio pretende reintroducir a Charles Lazarus y Geoffrey la Jirafa y recordar a los consumidores que, aunque Toys “R” Us solo tiene dos tiendas independientes en los Estados Unidos, la marca ahora tiene presencia en cada tienda Macy’s. Miller Olko indicó que la empresa planea transmitir el anuncio en varias plataformas de streaming y está considerando su emisión en televisión antes de la temporada navideña de este año.

El entrenamiento, en colaboración con Tidwit, está disponible desde el 5 de junio hasta el 20 de noviembre de 2024.

Amazon Web Services (AWS), proveedor de servicios en la nube, y Tidwit, plataforma de habilitación de ecosistemas digitales, han lanzado cursos de entrenamiento masivos gratuitos enfocados en inteligencia artificial generativa para 35,000 personas en Latinoamérica.

Este programa busca aumentar el conocimiento sobre esta tecnología en los países de habla hispana, centrándose en dos grupos principales: personas sin formación técnica y estudiantes sin experiencia previa en la nube o en inteligencia artificial.

“A medida que la IA generativa continúa avanzando rápidamente, desarrollar las habilidades que necesita el mercado de tecnología es crítico. Sin embargo, este entrenamiento representa una oportunidad única para adentrarse en el mundo de las tecnologías emergentes y más innovadoras para lograr un mejor desarrollo profesional en la era digital”, comentó Carolina Pina, líder de entrenamientos masivos para América Latina.


Participa en los  cursos gratuitos de AWS: detalles y registro

En estos cursos se explorarán aspectos fundamentales como qué es la IA generativa, cómo la aplica AWS y se profundizará en herramientas como Amazon Bedrock, Amazon CodeWhisperer, Amazon Inferentia, AWS Trainium y Amazon Sagemaker Jumpstart, mostrando sus funcionalidades y aplicaciones prácticas.

La capacitación regular y el conocimiento en tecnologías como la inteligencia artificial y habilidades en la nube son fundamentales, pues están ayudando a transformar negocios. Para ayudar a cerrar la brecha de talento capacitado, estimada por la consultora IDC en 2.5 millones de personas para 2026, AWS desarrolló el programa AI Ready para entrenar en habilidades de IA de manera gratuita a 2 millones de personas globalmente hasta 2025.

Aquellos interesados en participar en las capacitaciones de AWS deberán registrarse en la página de la iniciativa.

ChatGPT sufrió una caída global el 4 de junio de 2024, afectando tanto a la versión web como a la aplicación móvil. OpenAI, la empresa desarrolladora, confirmó el incidente en su sitio web y aseguró estar trabajando en una solución.

Esta es la segunda vez que ChatGPT presenta problemas en menos de un mes, lo que ha generado cierta preocupación entre los usuarios. Cabe destacar que la caída coincide con el anuncio de la próxima alianza entre OpenAI y Apple para mejorar las capacidades de Siri, la asistente virtual de iPhone.

Detalles del incidente:

  • Los usuarios no podían generar contenido ni acceder a conversaciones previas.
  • La falla afectó tanto a la versión gratuita como a la de pago.

Posible relación con la alianza:

Si bien no hay una confirmación oficial, algunos especulan que la caída de ChatGPT podría estar relacionada con la integración de su tecnología en Siri. Es posible que el aumento de la demanda en los servidores de OpenAI haya ocasionado la falla.

A pesar de este incidente, la alianza entre OpenAI y Apple sigue adelante. Se espera que la integración de ChatGPT mejore significativamente las capacidades de Siri, haciéndola más inteligente, receptiva y natural. Apple ha asegurado que será transparente con los usuarios, indicando cuándo una respuesta es generada por ChatGPT.

El ojo crítico de las autoridades sobre la inteligencia artificial


El mundo de la inteligencia artificial (IA) está en auge, y con ello, surgen nuevas preocupaciones, especialmente en lo que respecta a los acuerdos que las empresas de IA realizan con los creadores de contenido. Según un comunicado reciente del Departamento de Justicia de EE. UU., estos acuerdos están siendo examinados de cerca para garantizar la competencia justa y la protección de los derechos de los creadores.

Acuerdos que generan interrogantes

Empresas como OpenAI han establecido alianzas significativas con importantes proveedores de noticias, como News Corp., Financial Times y Dotdash Meredith. Estas colaboraciones implican la recopilación de vastas cantidades de datos de fuentes en línea para alimentar los sistemas de IA. Sin embargo, este intercambio de información ha despertado inquietudes entre los titulares de derechos de autor, quienes temen que sus obras sean utilizadas sin la debida compensación.

Monopsonio: el poder en manos de unos pocos

El centro de la controversia gira en torno al concepto de monopsonio, una situación en la que un solo comprador o un grupo reducido de compradores dominan un mercado. En este escenario, los creadores de contenido podrían verse en una posición de desventaja, con poco poder de negociación para establecer precios justos por su trabajo.

¿Qué se busca con este escrutinio?

Las autoridades antimonopolio buscan garantizar que los acuerdos de contenido de IA no obstaculicen la competencia ni perjudiquen a los creadores. Se trata de asegurar un equilibrio en el que las empresas de IA puedan acceder a los datos necesarios para su desarrollo, mientras que los creadores reciban una compensación justa por su trabajo.

Un futuro incierto para los acuerdos de IA

El futuro de estos acuerdos aún no está claro. Es probable que se implementen nuevas regulaciones para proteger a los creadores y promover la competencia. Sin embargo, es crucial encontrar un balance que permita el avance de la IA sin detrimento de la industria creativa.

Google ha anunciado la entrega de 120,000 becas en Hispanoamérica, lanzando un curso sobre Inteligencia Artificial (IA). Estas becas están destinadas a personas de cualquier edad y no requieren conocimientos previos en esta tecnología. De estas becas, 10,000 serán para Argentina, y los interesados pueden inscribirse a través del portal Potrero Digital.

Los participantes podrán acceder a los Certificados de Carrera de Google y al nuevo curso “Fundamentos de IA”. Este curso es completamente online y accesible a través del portal “Crece con Google”. Los especialistas de Google en Inteligencia Artificial enseñarán los principios básicos de esta tecnología, su potencial y cómo aplicarla en el día a día.

El curso, disponible en Coursera, consta de 5 módulos, tiene una duración de menos de 10 horas y se ofrece tanto en inglés como en español. Al finalizar, los participantes podrán obtener un certificado de Google. Marni Baker, Directora de Contenidos de Coursera, destacó la colaboración con Google: “Esta iniciativa no sólo forma a los alumnos en Inteligencia Artificial, sino que también les proporciona herramientas prácticas para incorporarla en sus tareas diarias y en el desarrollo de su carrera profesional”.

La inscripción, que es gratuita, comenzó el 23 de mayo.

INSCRIBITE ACÁ

Fundamentos de la Beca

Karan Bathia, Director Global de Asuntos Gubernamentales y Política Pública de Google, expresó: “Estamos muy emocionados. Google siempre ha creído en la responsabilidad de mejorar las competencias digitales de los países donde operamos. Hoy anunciamos 120,000 becas para mejorar las habilidades digitales a través de un nuevo curso llamado AI Essentials en toda América Latina, y específicamente 10,000 de esas becas serán para Argentina”.

Bathia subrayó que esta oportunidad está destinada a personas comunes que pueden mejorar sus perspectivas profesionales mediante la formación en inteligencia artificial. La iniciativa se realizará en colaboración con la Fundación Compromiso.

Comentarios sobre el Gobierno de Milei

En relación a los primeros seis meses del gobierno de Milei, Bathia comentó: “Ha atraído la atención global; la gente sigue lo que dice el presidente. Sus mensajes sobre la innovación y la reducción de la burocracia para el sector privado son bienvenidos. Estamos emocionados de ver cómo se desarrolla”.

Sobre la próxima visita de Milei a la sede central de Google en California, Bathia añadió: “Estamos honrados y deseando que el Presidente venga. Queremos mostrarle algunas de las tecnologías en las que estamos trabajando”.

Estos cursos se unen a la oferta de los Certificados de Carrera de Google, diseñados para adquirir conocimientos y habilidades en áreas tecnológicas de alta demanda, como Ciberseguridad, Marketing Digital, Comercio Electrónico, Soporte IT, y Análisis de Datos.

Hasta febrero de 2023, más de 50,500 personas se han graduado en Latinoamérica. Según Google, el 75% de los graduados reportan un impacto positivo en sus carreras en los primeros seis meses tras su graduación, ya sea obteniendo un nuevo trabajo, una promoción o un aumento salarial.

Un reciente estudio ha demostrado que ChatGPT, una herramienta de inteligencia artificial, puede igualar o incluso superar a los humanos en pruebas que miden la capacidad de representar el estado mental de otras personas.

La capacidad de inferir lo que otros están pensando, conocida como teoría de la mente, es una habilidad fundamental en las relaciones sociales humanas. Por ejemplo, si alguien menciona que hace calor en una habitación, es natural interpretar que desea abrir una ventana. Este tipo de lectura entre líneas es esencial para la interacción social.

Desde la llegada de ChatGPT en 2022, ha habido un intenso debate sobre si estas herramientas de IA pueden mostrar un comportamiento indistinguible del humano. Investigadores han buscado determinar si los grandes modelos de lenguaje (LLM, por sus siglas en inglés) como ChatGPT pueden captar estos matices. La investigación, publicada en la revista Nature Human Behaviour, muestra que estos modelos logran resultados iguales o superiores a los humanos en pruebas que implican inferir estados mentales.

Estudio Revela que ChatGPT Responde con Aparente Comprensión de Emociones y Pensamientos

“Los LLM generativos exhiben un rendimiento característico de las capacidades sofisticadas de toma de decisiones y razonamiento, incluyendo la resolución de tareas utilizadas para probar la teoría de la mente en humanos”, indican los autores del estudio.

El estudio utilizó dos versiones de ChatGPT (la gratuita, 3.5, y la avanzada, 4) y el modelo de código abierto de Meta, Llama 2. Estas herramientas fueron sometidas a una serie de experimentos para medir habilidades relacionadas con la teoría de la mente, como captar la ironía, interpretar peticiones indirectas, detectar conversaciones inapropiadas y responder a situaciones con información incompleta. Paralelamente, 1,907 individuos fueron expuestos a las mismas pruebas para comparar resultados.

El artículo concluye que ChatGPT-4 iguala o supera a los humanos en pruebas sobre identificación de peticiones indirectas, falsas creencias y desorientación, pero muestra dificultades para detectar pasos en falso (comentarios inapropiados). Curiosamente, Llama 2 superó a los humanos en esta última categoría, aunque se sugiere que esto se debe a un sesgo y no a una verdadera comprensión.

“Estos resultados no solo demuestran que los LLM pueden comportarse de manera coherente con los resultados de la inferencia mentalista en humanos, sino que también subrayan la importancia de realizar pruebas sistemáticas para garantizar una comparación precisa entre inteligencias humanas y artificiales”, afirman los autores.

De la Ironía a las Historias Complejas

El equipo de investigación desglosó la teoría de la mente en cinco categorías, realizando varias pruebas para cada una. Un ejemplo es la siguiente historia:

  • En una habitación están John, Mark, un gato, una caja transparente y un cofre de cristal. John mete el gato en el cofre y se va al colegio. Mientras John está fuera, Mark saca al gato del cofre y lo mete en la caja. Cuando John regresa, ¿dónde buscará al gato?

Esta historia, diseñada para confundir a las máquinas, demuestra que mientras los humanos reconocen la importancia de que la caja sea transparente, este detalle puede confundir a un chatbot. En esta prueba, los humanos superaron a la IA.

Otra prueba involucró una historia sobre un cuadro pintado por Laura y colgado en la casa de Olivia, con preguntas sobre las intenciones implícitas de los personajes. En estos casos, los grandes modelos de lenguaje igualaron o superaron a los humanos.

OpenAI ha presentado un nuevo modelo de inteligencia artificial que revolucionará la manera en la que los usuarios interactúan con ChatGPT. Ahora, el chatbot podrá responder a las peticiones de los usuarios mediante voz, además de comprender contenido en video y texto.

Un Modelo Más Rápido y Versátil

La CTO de OpenAI, Mira Murati, anunció que esta actualización, denominada GPT-4o, es significativamente más rápida y mejora las capacidades en texto, visión y audio. Durante el evento de lanzamiento, se mostró cómo esta actualización estará disponible de forma gratuita para todos los usuarios, con beneficios adicionales para los usuarios de pago, quienes tendrán límites de capacidad hasta cinco veces mayores.

La Voz de ChatGPT

Una de las características más destacadas de GPT-4o es su capacidad “nativamente multimodal”. Esto significa que el modelo puede generar contenido y comprender comandos en voz, texto e imágenes, lo que abre un abanico de posibilidades en la interacción entre humanos e inteligencia artificial.

Antes del lanzamiento de GPT-4o, hubo especulaciones sobre los planes de OpenAI, incluyendo la creación de un motor de búsqueda de IA para competir con Google y la introducción de un asistente de voz. Sin embargo, OpenAI se centró en mejorar la experiencia del usuario, ofreciendo las mismas capacidades que la versión tradicional, pero con el añadido de la interacción por voz.

Interacción Natural e Intuitiva

Anteriormente, la interacción con ChatGPT se limitaba al texto, pero con la introducción de la voz, los usuarios ahora pueden comunicarse con el sistema de manera más intuitiva y natural. GPT-4o puede procesar y generar respuestas en tiempo real, captando incluso la emoción en la voz del usuario y reproduciéndola en diferentes estilos.

Más Allá del Texto: Análisis de Imágenes y Comandos de Voz

Además de la voz, GPT-4o también mejora las capacidades de ChatGPT en el ámbito de la visión. El sistema puede analizar imágenes o capturas de pantalla y proporcionar información relevante o respuestas a consultas específicas.

Los desarrolladores también se beneficiarán de GPT-4o a través de la API de OpenAI, que ofrece acceso al modelo a mitad de precio y el doble de rapidez que GPT-4 Turbo. Esto permitirá integrar la capacidad de voz en sus propias aplicaciones y sistemas, abriendo nuevas posibilidades en el desarrollo de aplicaciones de IA.

Ejemplos de Uso de ChatGPT con Voz

Para ilustrar las capacidades de este nuevo modelo, OpenAI presentó varios ejemplos prácticos:

  • Charla casual: ChatGPT puede mantener conversaciones fluidas, respondiendo en tiempo real con un tono amigable y cercano.
  • Traducción: El asistente puede interpretar y traducir conversaciones en tiempo real entre diferentes idiomas, como inglés e italiano.
  • Análisis de imágenes: Usando la cámara del usuario, ChatGPT puede resolver problemas matemáticos, identificar objetos o jugar a piedra, papel o tijera.
  • Análisis de códigos y gráficos: ChatGPT comprende códigos de programación y puede proporcionar respuestas por voz, además de analizar imágenes de la computadora para generar contenido.

Con estas nuevas capacidades, ChatGPT se convierte en una herramienta aún más versátil y poderosa, mejorando significativamente la experiencia del usuario y ampliando las posibilidades de interacción con la inteligencia artificial.

Jensen Huang, el director ejecutivo de NVIDIA, ha afirmado que esperan desarrollar la inteligencia artificial general (AGI) en los próximos cinco años. Esta tecnología promete capacidades que trascienden las de los humanos, lo que podría alterar significativamente aspectos de la vida cotidiana y laboral.

Aunque actualmente estas afirmaciones son especulativas y Huang mismo reconoce que no se puede tener certeza debido a que los científicos aún no han descubierto todas las capacidades del cerebro humano, el desarrollo y la eventual llegada de la AGI es una posibilidad real. Esta tecnología difiere de la inteligencia artificial convencional, ya que no está diseñada para realizar tareas específicas dentro de un conjunto limitado de parámetros, sino que tiene la capacidad de aprender y adaptarse a diversas situaciones de manera autónoma, sin intervención humana directa.

NVIDIA, aseguró que esperan desarrollar en cinco años la inteligencia artificial general (AGI),

La AGI se destaca por su potencial para aprender nuevas habilidades y adaptarse a contextos novedosos sin necesidad de un entrenamiento adicional. Por ejemplo, a diferencia de un sistema de IA diseñado para traducir idiomas que requeriría entrenamiento manual para cada nuevo idioma, un sistema AGI podría aprender a traducir idiomas adicionales por sí mismo simplemente al estar expuesto a datos de entrenamiento en ese nuevo idioma.

Si bien la AGI representa un avance emocionante, también plantea desafíos éticos, de seguridad y laborales. Se cuestiona cómo las máquinas podrán actuar de manera ética y respetuosa sin control humano directo, así como también se plantea la posibilidad de que el crecimiento autónomo pueda poner en riesgo la información o incluso afectar al mercado laboral al reemplazar trabajadores con IA.

En resumen, la llegada de la inteligencia artificial general podría significar un cambio radical en la forma en que interactuamos con la tecnología y en cómo funciona nuestra sociedad en general. Su desarrollo y consolidación son objeto de investigación por parte de empresas como Microsoft, Google, OpenAI y NVIDIA, lo que sugiere que este futuro podría estar más cerca de lo que imaginamos.

Bill Gates tenía razón: se está cumpliendo su predicción sobre el trabajo

La inteligencia artificial (IA) ha sido tema de debate entre las figuras más prominentes del ámbito tecnológico, entre ellas el cofundador de Microsoft, Bill Gates, quien anticipó que “industrias completas se reconfigurarán” debido a esta herramienta.

En su blog personal, el magnate señaló que la IA tendrá un impacto significativo en el mercado laboral, sugiriendo que las personas adquieran habilidades relacionadas con estos nuevos desarrollos tecnológicos para asegurar una carrera relevante en el futuro.

Gates no está solo en esta visión. Sus palabras resuenan en el emprendedor estadounidense Peter H. Diamandis, quien recientemente enfatizó la importancia de prepararse para los cambios que traerá la IA al mundo laboral.

A través de su cuenta personal de X (antes Twitter), Diamandis lanzó una predicción que refleja las palabras de Gates: “El impacto de la IA en el mercado laboral será significativo”. Además, destacó la necesidad de prepararse para el futuro: “No solo es prudente, es esencial. Todo ser humano debería tener la oportunidad de aprender y utilizar la IA en su beneficio”, afirmó.

Bill Gates había señalado en su blog que, debido al rápido avance de la IA, las ocupaciones más óptimas estarán relacionadas con la investigación, implementación y comercialización de estas tecnologías, además de que otros campos como la energía o la biología también verán un crecimiento.

“La IA es una de las cosas más importantes que sucederán en nuestras vidas en los próximos 100 años. Tendrá un impacto mayor que Internet”, llegó a decir Gates en una entrevista.