AI Solutions in Broadcasting Companies - En.es

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 15

Traducido del inglés al español - www.onlinedoctranslator.

com

soluciones de IA
en la radiodifusión
empresas

Cómo las empresas de radiodifusión pueden


beneficiarse de las tecnologías de IA

Pietro Scarpino, Adriano Manfrè, Claudia Lunini

nttdata.com
02Índice

Índice

4 Introducción
Proveedores de IA e integradores de sistemas

5 Desafíos en la Radiodifusión

7 Tecnologías de IA para análisis de video


Enseñar a las máquinas a ver Potenciar la
computación con la nube Acercar la
computación a las fuentes

9 La adopción de la IA
en la industria de la radiodifusión
Creación de contenido inteligente

Producción de contenido inteligente


Índice03

10 TT Data Video AI Platform: IA para


norte
es procesos de transmisión mejorados
Extracción de metadatos

Reconocer quién está hablando

Generar destacados

Comprobación de anomalías

Televisión mejorada

14
C
onclusiones
04Introducción

Introducción
“No hay alternativa a la Sin embargo, diferentes aplicaciones de IA en dichos
campos han brindado resultados potenciales con la
transformación digital. Las consecuencia de traer varios beneficios además de
empresas visionarias crearán tener un gran impacto en las cadenas de valor de las
empresas.
nuevas opciones estratégicas para
sí mismas; las que no se adapten, Proveedores de IA e integradores
fracasarán.” de sistemas

Jeff Bezos, Amazonas Las empresas que se han acercado al desarrollo de


soluciones de IA son de lo más diversas y ofrecen
servicios siempre actualizados y competitivos. En
El proceso de digitalización que estamos
particular, en los últimos años, los grandes proveedores
presenciando está cambiando profundamente los
de la nube han ampliado significativamente su oferta en
modelos de negocio y está afectando el valor de los
torno a las soluciones de IA, brindando tanto soluciones
bienes y servicios existentes. La transformación
de trabajo (API, productos SaaS, modelos
digital resultante está creando nuevas necesidades
preentrenados, etc.) como herramientas para facilitar la
que requieren procesos más rápidos y eficientes. Por
creación de nuevos servicios de aprendizaje automático.
esta razón, las empresas de todas las industrias
Además, continuamente nacen nuevas startups
necesitan una profunda transformación para
desarrollando capacidades de IA que cubren las
adaptarse a estas innovaciones.
necesidades más diversas y específicas.

En el contexto de la radiodifusión, en particular, las nuevas


Los casos de uso habilitados por la IA son de hecho muy
tecnologías han permitido a los consumidores nuevos tipos
diversos y, a menudo, se refieren a dominios específicos,
de experiencias. De hecho, los espectadores tienen acceso y
donde las soluciones de IA listas para usar probablemente
consumen más contenido que nunca, en cualquier momento
fallan o tienen un rendimiento deficiente. Por lo tanto, estas
y en cualquier lugar. Esperan contenido personalizado y de
soluciones a menudo deben mejorarse y personalizarse para
alta calidad de sus diversos proveedores, junto con una
cumplir con los requisitos del caso de uso. En este escenario,
experiencia diferente en múltiples dispositivos.Los
elEl integrador de sistemas juega un papel crucial,
organismos de radiodifusión necesitan producir múltiples
combinando un profundo conocimiento técnico y una visión
versiones del mismo contenido a velocidades más rápidas y
empresarial mientras trabaja cerca de los clientes y sus
a costos más bajos,mientras que la competencia por la
necesidades.NTT Data, gracias a su experiencia como
atención de los espectadores aumenta tanto para el
Trusted Global Innovator, tiene la experiencia para crear
contenido en vivo como para Video-On-Demand.
productos personalizados de extremo a extremo que
pueden aprovechar el poder de las herramientas de los
grandes proveedores y las innovaciones de las empresas
Entre las tecnologías utilizadas en la industria de la
emergentes mejoradas por soluciones a medida que se
radiodifusión, la Inteligencia Artificial (IA) está
adaptan a las necesidades de los clientes. necesidades y
demostrando ser una de las herramientas más
entregar un mayor valor.
efectivas para integrarse en diversas áreas e
industrias. De hecho, las capacidades de IA han
experimentado un rápido crecimiento en los últimos
años y, en consecuencia, las empresas han
aumentado su interés por estas herramientas. Si bien
las empresas en muchas áreas han empleado la IA
en sus proyectos,la adopción de IA en los procesos
de los medios y las empresas de radiodifusión aún se
encuentra en una etapa temprana.
Desafíos en la Radiodifusión05

Desafíos en
la Radiodifusión Otra actividad costosa en términos de tiempo y
esfuerzo humano es el control de calidad de video
(VQC), que es esencial para distribuir contenidos que
La generación y entrega de cumplan con las normativas. Este procedimiento

contenidos con fines de difusión consiste en un análisis visual, realizado fotograma a


fotograma, que tiene como objetivo determinar si se
es un proceso complejo y lento, producen o no anomalías en el contenido. Las

compuesto de muchas etapas en anomalías, por ejemplo, se relacionan con la calidad


del video que puede deberse a imágenes antiguas,
las que incluso si el contenido es de alta resolución, o el brillo

la creatividad y la rutina o los colores de los marcos, mientras que algunas


anomalías pueden relacionarse con la presencia o
se unen. ausencia de los subtítulos correctos. . Otra serie de
anomalías se refiere a la presencia de áreas
Desde la fase de creación de contenidos hasta la de específicas del video donde aparecen algunos letreros
entrega, pasando por la producción y gestión de con texto extranjero sin la traducción correcta.
contenidos, los retos a los que se enfrentan los
broadcasters son múltiples. Otra tarea costosa se refiere a la generación de
repeticiones y momentos destacados. Es difícil
Por ejemplo, en la fase de gestión de contenidos se imaginar ver un evento o una transmisión deportiva
requiere la extracción de metadatos de los vídeos. en vivo sin resúmenes. Todas las plataformas y los
Dicha actividad consiste en etiquetar cada contenido de canales ofrecen resúmenes deportivos a un ritmo
video con toda la información (cuanto más, mejor) que creciente. El trabajo manual requerido para crear
se relacione con el video. Por ejemplo, en los videos, la resúmenes de cinco o diez minutos de eventos
información como la categoría (por ejemplo, deportes, deportivos en vivo es significativo. Además, también
noticias, entretenimiento, etc.), los objetos relevantes, se debe tener en cuenta el sesgo de atención humana:
las ubicaciones y el tema principal discutido deben los humanos inevitablemente se pierden cosas.
estar asociados al contenido. Otro ejemplo de
información relevante es la identificación de las Finalmente, para mejorar aún más la experiencia de los
personas que están hablando. Por ejemplo, durante las clientes, la posibilidad de mostrar información relevante
elecciones políticas es importante asegurarse de que superpuesta en el televisor representa una característica
los políticos de diferentes partidos tengan la misma extremadamente atractiva. Para permitir eso, las empresas de
cantidad de tiempo para expresar sus pensamientos. radiodifusión cuentan con numerosos equipos, cada uno de
Esta actividad se basa en un grupo de operadores ellos con experiencia en diferentes áreas. De hecho, por
humanos que, al observar el contenido, anotan quién ejemplo, mientras que los contenidos de cine necesitan
habla, cuándo y durante cuánto tiempo. mostrar datos sobre actores y personajes, los eventos
deportivos necesitan gestionar diferentes
06Desafíos en la Radiodifusión

datos. Por ejemplo, en los eventos de fútbol, las estadísticas


de los jugadores y cómo se mueven los equipos en el campo
son información relevante. De manera diferente, en las
carreras de autos, es importante mostrar diferentes vistas (por
ejemplo, dentro del automóvil o en una posición particular de
la pista), así como también las posiciones de los corredores en
curso en la pista. Finalmente, los programas de cocina son un
canal importante para monetizar con objetos patrocinados (por
ejemplo, utensilios de cocina) y, por lo tanto, es importante
brindar información sobre ellos.

Los desafíos en esta industria ciertamente aún son


muchos, pero no representan el corazón de este
documento.

Sin embargo, estos pocos ejemplos son suficientes para


demostrar queLas capacidades de IA podrían desempeñar
un papel activo para superar los desafíos que enfrenta la
industria de la radiodifusión.La adopción de IA, de hecho,
proporciona no solo la automatización y aceleración de
procesos, sino que también puede brindar un alto valor
agregado al mejorar la efectividad de dichos procesos y
reducir los costos.
Tecnologías de IA para análisis de video07

Tecnologías de IA
para análisis de vídeo
Enseñando a las máquinas a ver

De todas las tecnologías de Inteligencia Artificial,


Visión por computadores una de las más atractivas
en el campo de la Radiodifusión y está, en general,
entre las más prometedoras.

Computer Vision es el campo de las ciencias de la computación


que se enfoca en la replicación de las capacidades del sistema
de visión humano, lo que permite que las computadoras vean,
identifiquen y procesen imágenes de manera similar a como lo
hacen los humanos. Es un campo multidisciplinario, que puede
involucrar el uso de métodos especializados de procesamiento
de imágenes y algoritmos de aprendizaje. La variedad de tareas
que puede llevar a cabo Computer Vision, como la clasificación
de imágenes, la detección de objetos, el reconocimiento de
rostros, el reconocimiento de acciones, el reconocimiento de
emociones, el reconocimiento óptico de caracteres (OCR), etc.,
deja claro por qué este campo es ampliamente aplicable.

En la década de 1960, Computer Vision comenzó a


tomar forma como un campo. Intentó imitar el sistema
de visión humana combinando técnicas estándar de
procesamiento de imágenes con algoritmos generales
de aprendizaje. La década de 2010 vio un progreso
dramático en el procesamiento de imágenes ganando
popularidad entre la industria y las comunidades de
investigación. Esto se debe a las innovaciones y
resultados obtenidos al aplicar las técnicas de Deep
Learning (DL) a tareas de clasificación de imágenes. Los
recientes avances en Inteligencia Artificial y en
particular en Deep Learning y la madurez alcanzada en
las tecnologías Big Data, permitieron que la Visión
Artificial triunfe e incluso supere el rendimiento
humano. Como ejemplo, recienteLos algoritmos de
aprendizaje profundo superaron a los humanos al
obtener un error menor en algunas tareas relacionadas
con la detección y etiquetado de objetos.

El éxito de las técnicas de aprendizaje profundo se basa en


el poder de las redes neuronales (NN). Consisten en un
conjunto de algoritmos de inspiración biológica
pertenecientes a la categoría de métodos de aprendizaje y
hoy en día se encuentran entre los más potentes.
08Tecnologías de IA para análisis de video

Su poder radica en una estructura compleja, hecha de diferentes


capas, cada una de las cuales está compuesta por diferentes
Acercando la computación
unidades, llamadas neuronas que elaboran la entrada. La entrada a las fuentes
pasa a través de varias capas ocultas donde es transformada por
El gran avance en las tecnologías de hardware también jugó un
diferentes funciones hasta que alcanza su forma final. Las redes
papel importante en la difusión de la IA. De hecho, la visión
neuronales son especialmente adecuadas para extraer
artificial y los algoritmos de procesamiento de imágenes
automáticamente patrones y relaciones complejos que existen
pueden ser computacionalmente intensivos y, a menudo,
dentro de un conjunto de imágenes. De hecho, los NN, mientras se
superan las capacidades en tiempo real. Además de la
capacitan en una gran cantidad de datos etiquetados, aprenden de
computación en la nube, las GPU modernas también permiten
manera incremental cuáles son las características relevantes
realizar una amplia gama de algoritmos de visión por
relacionadas con el problema a evaluar.
computadora.
Además, cada vez que falla la limitación a los enfoques
Una de las Redes Neuronales más involucradas en el de implementación estándar, como por ejemplo, la
campo de la Visión por Computador es laRed neuronal conectividad de la red no está disponible, o la latencia
convolucional (CNN),que es un tipo particular de red de la red es insuficiente, o hay problemas de privacidad
neuronal que desempeñó un papel central en el y seguridad, Edge Computing resulta útil. De hecho, los
aumento de la popularidad y el éxito del aprendizaje nuevos dispositivos permiten el cálculo local de
profundo. Su arquitectura intenta replicar el patrón de algoritmos de IA en el "borde", con poca o ninguna
conectividad y la organización de las neuronas de la conectividad de red. Con Edge Computing, las
Corteza Visual en el Cerebro Humano. Son imágenes y los videos se pueden acercar a sus fuentes,
particularmente adecuados para elaborar imágenes y de modo que se pueden disminuir los problemas de
su uso casi no requiere procesamiento previo. De latencia, lo que abre nuevos escenarios para la
hecho, mientras que en los métodos primitivos los aplicación de Computer Vision, y también se pueden
filtros se diseñaron a mano para cumplir con las tareas abordar las preocupaciones de seguridad y privacidad.
de Computer Vision, estas redes pueden aprender
automáticamente el conjunto de filtros que mejor se
adaptan a la tarea. En particular, las CNN logran crear
los filtros para que la información significativa sea
extrapolada de las imágenes. Ejemplos de dicha
información son los bordes y las formas de los objetos,
que se utilizarán para adquirir la capacidad de
distinguir entre diferentes clases de imágenes.

Empoderamiento de la computación
con la nube
Otro factor importante que ha tenido un gran impacto en
el éxito de Computer Vision es el poder computacional
proporcionado por las tecnologías de la nube. La
computación en la nube, de hecho, permite manejar,
almacenar y computar una gran cantidad de datos en el
mismo lugar y esto, a su vez, permite entrenar
adecuadamente los modelos de aprendizaje profundo para
hacerlos efectivos. Además, los principales proveedores de
la nube, como Google, AWS y Microsoft, también ofrecen
potentes servicios cognitivos capaces de cubrir varias
tareas de visión por computadora y otras tareas de IA.
Estos servicios se pueden usar simplemente a través de
llamadas API, incluso sin un conocimiento profundo de
Inteligencia Artificial.
La adopción de la IA en la industria de la radiodifusión09

La adopción
de IA en el Producción de contenido inteligente

Radiodifusión La fase de producción es muy amplia y rica en actividades


donde la Inteligencia Artificial puede dar una valiosa
contribución. Por ejemplo, la generación manual de

Industria leyendas y subtítulos en un video puede ser muy costosa.


Por el contrario, las funciones de conversión de voz a
texto, junto con el análisis y la traducción automáticos del
Los organismos de radiodifusión puedenaprovechar la IA no solo
idioma, permiten la generación automática de subtítulos y
para automatizartareas repetitivas y que consumen mucho tiempo
subtítulos casi en tiempo real en varios idiomas. Estos
actualmente realizadas por operadores humanos,sino también
procedimientos, que a los humanos les llevan varias
para apoyar a los operadores en sus actividades,
horas, pueden ser realizados instantáneamente por una
mejorando su experiencia,haciendo el trabajo más
máquina.
fácil, menos repetitivo dejando más espacio para la
Además, por lo que respecta a la extracción y generación
creatividad y los recursos cognitivos.
de metadatos, las técnicas de Visión por Computador son
La automatización no es la única ventaja que la IA puede
efectivas. Permiten detectar automáticamente objetos
aportar. De hecho, estas tecnologías realmente pueden
relevantes en la escena, reconocer personas, ubicaciones e
crear valor, ya que tienen la capacidad de replicar la
incluso clasificar acciones. Computer Vision demostró ser
mayor parte de la estrategia de decisión humana, en un
también poderoso en la fase de monitoreo, simplificando y
tiempo mucho más corto. Es más,Las tecnologías de IA
agilizando el proceso de verificación de calidad de video.
pueden reducir los errores humanos y pueden mejorar la
precisión y la eficiencia.
La generación de repeticiones y momentos destacados
La Inteligencia Artificial, y en particular la Visión Artificial,
también se puede realizar mediante tecnologías de IA. Las
encuentra una amplia gama de aplicaciones en las
técnicas de Visión por Computador pueden realizar este
empresas de Radiodifusión, aportando beneficios en
proceso en un tiempo mucho más corto alcanzando un
muchas etapas de la cadena de contenidos digitales.
resultado aún mejor, ya que puede detectar
simultáneamente varias escenas clave casi en tiempo real y
Creación de contenido inteligente no sufre el sesgo al que está sujeto el operador humano al
observar una escena.
Partiendo de la etapa de creación, la primera etapa de la Estos son solo algunos ejemplos que muestran cómo la
cadena de contenido, la IA encuentra aplicaciones introducción de la IA, en particular la visión por
interesantes apoyando a los operadores en el proceso de computadora, puede ayudar a los humanos en varias
creación, y automatizando aquellas tareas en las que no tareas en la empresa de transmisión y brindar información
se requiere creatividad. Esto, a su vez, permite a los sobre el potencial de estas tecnologías.
operadores humanos concentrarse en tareas donde se
requiere creatividad.
Edge Computing encuentra aquí una aplicación muy
atractiva: usar IA aplicada en el borde para automatizar
las operaciones de la cámara. Por ejemplo, se han
introducido soluciones de captura de imágenes
automatizadas para emisoras y clubes deportivos. Esta
solución consiste en un sistema de captura de video
robótico que ofrece automatización, flexibilidad y calidad
de imagen con poca luz; mueve la cámara de forma
autónoma y ajusta el zoom y el enfoque para mantener
automáticamente al equipo o al jugador en el encuadre.
10Plataforma de IA de video de datos NTT

DATOS NTT
IA de vídeo
Plataforma: IA obtener el mejor rendimiento y ahorro de costes.

para mejorado Además, la plataforma permite incluir también


modelos personalizados desarrollados con

radiodifusión
técnicas avanzadas de Deep Learning y Machine
Learning necesarias para realizar tareas
específicas en las que es importante considerar la

procesos peculiaridad del dominio.

Gracias a la arquitectura modular, la plataforma Video AI


gracias a unestrecha colaboración con los principales
puede integrarse completamente con los procesos y
actores de la industria de la radiodifusión, NTT DATA ha
herramientas preexistentes de los clientes, lo que
desarrollado una fuerte conciencia de sus desafíos y
permite optimizar los procesos internos con el
necesidades,lo que permitió proporcionar soluciones
consiguiente ahorro de tiempo, reducción de costos de
de IA ganadoras capaces de apoyar a los operadores de
gestión y minimización de riesgos operativos.
medios en diferentes dominios/actividades.

La plataforma está diseñada para habilitar el paradigma


Aprovechando las iniciativas de I+D, la inversión
de “IA asistida por humanos”:Los expertos humanos
interna y las asociaciones con las emisoras NTT
ayudan a que la IA sea más precisa con el tiempo y, a su
DATA ideado y desarrolladoVideo AI Platform: una
vez, la IA ayuda a los expertos humanos a ser más
solución modular diseñada para mejorar los
productivos. Gracias a la interfaz fácil de usar, los
procesos de los Broadcasters con Inteligencia
operadores pueden interactuar con la plataforma,
Artificial.Consiste en una plataforma capaz de
personalizar la configuración, validar y modificar la
manejar varias necesidades de esta industria
salida a través de funciones y herramientas (dashboard,
explotando tecnologías de Inteligencia Artificial;
consolas, informes) con total libertad.
permite la integración, orquestación y combinación
de múltiples proveedores de tecnología de IA,
incluida la tecnología patentada de NTT DATA. En la cadena de valor de la transmisión, Video AI
Platform puede atender varios procesos, lo que permite
la automatización de la producción, el empaquetado y la
La arquitectura de Video AI Platform ha sido diseñada para
distribución de contenido. La idea detrás del diseño de la
garantizar una alta flexibilidad. De hecho, es posible
plataforma Video AI, de hecho, es tener múltiples
agregar nuevas capacidades y algoritmos personalizados e
módulos de trabajo que puedan emplearse para
integrarlos con los servicios cognitivos estándar para
producir datos relevantes para un caso de uso particular;
satisfacer las necesidades del cliente, y la integración es
incluye diferentes módulos cada uno de los cuales es
sencilla. Esto le da a la solución, el poder y la eficiencia de
responsable de una tarea específica.
los servicios externos y, al mismo tiempo, la flexibilidad de
conectar modelos personalizados para una personalización
completa. Hasta ahora, los módulos incluían operadores de
apoyo en la producción de metadatos y
reconocimiento de locutores, en la generación de
Video AI es independiente de la nube y ofrece la
destacados y en el control de calidad del video.
integración de la más amplia variedad de servicios
cognitivos, ya sea que los proporcionen los proveedores de
la nube o las nuevas empresas. Esto permite elegir la
tecnología adecuada entre las múltiples disponibles para
Plataforma de IA de video de datos NTT11

Extracción de metadatos Generación de destacados


Gracias al módulo de producción de metadatos, la La generación de los aspectos más destacados es una
plataforma Video AI permite apoyar a los operadores a característica adicional proporcionada dentro de la
través de la generación automática de información útil plataforma de IA de video de NTT Data. La generación de
a partir de contenidos de video, como aparición de resúmenes es una parte crucial de la etapa de producción,
personas y objetos, transcripción de audio, etc. En en particular para los contenidos relacionados con el
detalle, el módulo realiza las siguientes tareas deporte, y es una tarea muy costosa. El módulo de
principales: Reconocimiento de objetos, generación de destacados consiste en un sistema que
Reconocimiento de rostros, Reconocimiento de crea automáticamente destacados de video de acuerdo
escena/entorno, Transcripción de texto de audio en con las preferencias del usuario. El módulo emplea
diferentes idiomas, Resumen de texto y palabras clave, técnicas de aprendizaje profundo para crear un modelo
frase clave y extracción de temas. de estimación de la importancia de la escena que estima
El módulo de producción de metadatos se compone la importancia de cada escena dentro de un video. Para
de tecnologías de visión por computadora y NLP para comprender la importancia de una escena, el algoritmo
manejar los datos de audio y los contenidos de video y considera varias características: las emociones de las
proporcionar como salida los metadatos generados. personas que aparecen en el video, las acciones en la
Este módulo ofrece como característica la posibilidad escena, así como el ruido en el audio (vítores, por
de entrenar el sistema sobre nuevos objetos o ejemplo) y la información de la partitura, en particular.
personas de interés que se pueden agregar fácilmente para eventos deportivos en vivo.
a la base de conocimiento, o incluso más, personalizar
el vocabulario del motor NLP adaptando la extracción
Comprobación de anomalías
a un dominio específico mejorando la calidad y
cantidad de metadatos según el contexto. Esto brinda Otra actividad crucial en el proceso de transmisión es el
a los usuarios una gran flexibilidad y toda la control de calidad de video que también pueden realizar
personalización que necesitan. los operadores que utilizan la plataforma NTT Data Video
AI. La plataforma contiene, de hecho, el módulo Control
La Inteligencia Artificial, y en particular la Visión Artificial, de calidad de video aumentado (AVQC), que es capaz de
encuentra una amplia gama de aplicaciones en las manejar anomalías potenciales en el contenido de video
empresas de Radiodifusión, aportando beneficios en explotando diferentes algoritmos de IA. Dicho módulo
muchas etapas de la cadena de contenidos digitales. representa una herramienta de apoyo para los
operadores de control de calidad durante el proceso de
reconociendo quien VQC. El módulo aprovecha varias capacidades de IA
personalizadas, desde el análisis estadístico hasta las
está hablando
redes neuronales profundas, así como la integración de
Para ayudar a los operadores a identificar a las servicios cognitivos.
personas que están hablando dentro de un video, la Dado que las anomalías visuales (por ejemplo,
plataforma Video AI se ha enriquecido al proporcionar inconsistencias de color, patrones antiguos, etc.) en
el módulo para el "reconocimiento del hablante". Este el video dependen del contexto de la escena, el
módulo realiza el análisis de los oradores casi en módulo AVQC ha sido diseñado y desarrollado con
tiempo real y genera la información del orador sobre varias redes neuronales profundas personalizadas
el contenido, lo que permite que los operadores para superar la falta de servicios cognitivos
evalúen dichos resultados con facilidad. El módulo es proporcionados.
capaz de identificar de manera única en un video/ Las redes neuronales personalizadas desarrolladas se
audio, dado como entrada, los segmentos en los que inspiran en el estado del arte en DL. En particular,
está hablando una persona. En concreto, crea una estos DNN pueden extraer características de los
huella dactilar de la voz para poder distinguir a una cuadros del video y analizar la secuencia de
persona entre las demás. Para crear la huella digital, características para detectar una posible anomalía
se desarrolló una red neuronal con el objetivo de según el contexto. Para algunas anomalías se ha
mapear las voces de las personas en representaciones diseñado una arquitectura jerárquica compuesta por
matemáticas únicas. múltiples redes neuronales. Cada neural
12Plataforma de IA de video de datos NTT

la red contribuye, extrayendo información


intermedia, para lograr/alcanzar el objetivo final.
Por ejemplo, en ciertas anomalías, el motor
inteligente necesita determinar cuáles son las
áreas del video en las que se enfoca el
espectador, correlacionando la información de
fotogramas consecutivos. Para ello, una Red
Neural Profunda específica, en el paso intermedio,
puede determinar el área relevante dentro de la
cual la última red detectará la anomalía.

Televisión mejorada

La plataforma Video AI permite extraer mucha


información, como datos sobre los actores y
personajes que aparecen en un video, estadísticas
sobre los jugadores y cómo se mueven los equipos en
la cancha, en lo que respecta a eventos deportivos y
otra información de interés para los consumidores. De
hecho, los datos del módulo de producción de
metadatos sobre objetos, escenas y actores, pueden
combinarse con el módulo de reconocimiento de
locutores que identifica quién está hablando en
contenidos de entretenimiento, para que los usuarios
tengan toda esta información a simple vista. Otro
ejemplo se refiere a los eventos deportivos, en los que
el módulo generador de momentos destacados ya
resume las escenas más importantes del evento que
se ponen en conocimiento del cliente.

La estructura modular de la plataforma permite agregar


nuevos bloques para realizar tareas específicas. En
particular, se pueden incluir fácilmente nuevos módulos
como, por ejemplo, la visualización de datos para eventos
deportivos (p. ej., estadísticas de equipos de fútbol,
posiciones de corredores, etc.), para enriquecer el
contenido a mostrar, brindando una nueva e increíble
experiencia de visualización al usuario final.

Dadas las capacidades de la plataforma, es fácil


comprender los beneficios derivados de su uso:
minimiza el esfuerzo humano necesario para NTT DATA tiene
realizar las actividades, aumenta los contenidos de proporcionando ganar
vídeo analizados y la eficacia de los servicios, y al
mismo tiempo, reduce los costes y el tiempo. soluciones de IA
capaz de apoyar
operadores de medios
en diferentes
dominios/actividades.
Plataforma de IA de video de datos NTT13

Control de calidad aumentado Generador de metadatos

Destacados deportivos/noticias Reconocimiento de altavoz de voz

Alertas de contenido explícito Publicidad en tiempo real


Conclusiones14

Conclusiones
La Inteligencia Artificial en los medios y la radiodifusión cada vez más necesidades, haciendo de la
está demostrando ser un aliado valioso y está brindando plataforma un producto en continua
resultados tangibles. Las empresas que han adoptado transformación. Dicha transformación la
soluciones impulsadas por IA han obtenido beneficios en llevarían a cabo las propias emisoras en función
términos de aumento de la eficiencia de los procesos, de sus necesidades al asociarse con los
optimización de la fuerza laboral interna y reducción de expertos de NTT DATA que brindan apoyo,
costos. Además, las capacidades de la IA están creciendo experiencia y conocimientos en dicha área.
a un ritmo increíble y las posibilidades de aplicar la IA a
esta industria aún son muchas y es probable que
aumenten aún más.

Hoy en día, el mercado de la IA es muy rico y


competitivo y ofrece muchos servicios de
computación en la nube, algoritmos listos para usar y
mayor poder computacional que permiten a todos
explotar las capacidades de la IA. Sin embargo, no
siempre es sencillo elegir entre las varias opciones ya
disponibles, y esto no es solo una cuestión de
tecnología. Podría haber muchos otros factores
externos e internos que desempeñen un papel clave
en la definición de una solución de IA. Por ejemplo, la
introducción de un motor inteligente en la
infraestructura del cliente preexistente no siempre es
sencilla y puede afectar los procesos en varios pasos.
Además, requiere la conciencia y el conocimiento de
la IA, la confianza en esta nueva tecnología y, por
último, pero no menos importante, las expectativas y
la percepción de las personas sobre la introducción
de la IA en su vida diaria.

La amplia experiencia de NTT DATA en la industria de


la radiodifusión junto con la profunda experiencia en
tecnologías de IA pueden ayudar a los clientes a
navegar correctamente hacia estas tecnologías y
permitir crear productos valiosos que respondan a
los desafíos del cliente y se adapten mejor a las
necesidades de los clientes, aportando valores al
mejorar la procesos y optimizar la asignación de
mano de obra. Los DATOS NTT
plataforma de video IA,
La plataforma NTT DATA Video AI, de hecho, ya
constituye una herramienta de soporte de gran constituye un soporte
impacto para los operadores de transmisión,
herramienta de gran impacto
facilitando tareas costosas como la extracción de
metadatos, la generación de resúmenes y el para transmisión
proceso de VQC. No obstante, la flexibilidad con la
que ha sido diseñado garantiza la posibilidad de
operadores, facilitando
una evolución que pretende cubrir tareas costosas
Persona de contacto

Pietro Scarpino
Jefe de línea de servicio de IoT, VR e IA

NTT DATA Italia

Adriano Manfrè
Líder del equipo de IA

NTT DATA Italia

claudia lunini
Científico de datos

NTT DATA Italia

NTT DATA, una parte de NTT Group, es un innovador global confiable de TI y servicios
comerciales con sede en Tokio. Ayudamos a los clientes a transformarse a través de
consultoría, soluciones industriales, servicios de procesos comerciales, modernización de
TI y servicios administrados. NTT DATA permite a los clientes, así como a la sociedad,
avanzar con confianza hacia el futuro digital. Estamos comprometidos con el éxito a largo
plazo de nuestros clientes y combinamos el alcance global con la atención al cliente local
para atenderlos en más de 50 países. Visítenos en nttdata.com

También podría gustarte