• 01/07/2026 05:15

13.20h a 13:50hMés enllà dels models de llenguatge: els models multimodals

Tiempo estimado de lectura: 1 minutos, 51 segundos

Més enllà dels models de llenguatge: els models multimodals

21 octubre 2026 | 13.20h a 13.50h

Els models multimodals representen una nova generació de sistemes d’IA capaços d’integrar i interpretar simultàniament text, imatges, àudio i vídeo. En aquesta sessió coneixerem dos projectes que exploren el potencial d’aquests models, mostrant com la combinació de diferents fonts de dades genera valor en aplicacions tan diverses com la gestió de fons documentals per a mitjans de comunicació o l’automatització de l’elaboració de pressupostos en entorns industrials.

Participa:

  • Carles Rams Grau, CEO, Ebantic Systems

  • Nicolas Carrasco Heuri, CTO, UNNIC AI HUB

Ponents:

CARLES RAMS GRAU

CEO, Ebantic Systems

Carles Rams és CEO i cofundador d’Ebantic, empresa especialitzada en plataformes de gestió i distribució de contingut audiovisual per a mitjans i institucions. Graduat en Empresarials per la UOC i PDG per IESE, acumula més de 25 anys d’experiència al sector, amb projectes a TV3 i Mediapro com la continuïtat i l’arxiu digital de vídeo de laSexta. Des d’Ebantic lidera projectes d’IA aplicada a fons documentals i hemeroteques, entre ells el sistema d’indexació i consulta conversacional de l’arxiu de l’Agència Catalana de Notícies, desenvolupat en consorci amb Amplify, Watchity, Coeli i Aureacolor. És secretari del Clúster Digital de Catalunya.

ACN-IA: una web híbrida per navegar i dialogar amb una hemeroteca multimodal

L’Agència Catalana de Notícies acumula més d’un milió de notícies textuals i centenars de milers d’àudios, fotografies i vídeos. Els cercadors convencionals per paraula clau no en capturen el context ni les relacions semàntiques. ACN-IA proposa una web híbrida que combina navegació estructurada i diàleg conversacional amb IA: l’usuari pot explorar amb menús i filtres o preguntar en llenguatge natural i rebre respostes citades i multimèdia. La solució integra una pipeline de 18 models d’IA per a la indexació, RAG sobre fons multimodals i models en català. Un paradigma escalable a qualsevol agència o hemeroteca.

NICOLAS CARRASCO HEURI

CTO, UNNIC AI HUB

Nicolás Carrasco és CTO i cofundador d’Unnic AI. La seva feina se centra a analitzar com la intel·ligència artificial està redefinint el desenvolupament de programari i la manera com les empreses resolen problemes complexos. Convençut que ens trobem davant d’un canvi de paradigma tecnològic, ajuda les organitzacions a identificar oportunitats reals de transformació i a convertir-les en solucions aplicables. Combina una visió estratègica de la IA amb experiència en arquitectura tecnològica, automatització i disseny de sistemes intel·ligents orientats al negoci.

Més enllà del chatbot: IA aplicada a la pressupostació industrial

La pressupostació és un dels processos més crítics i complexos de moltes empreses industrials. Cada sol·licitud pot implicar documentació tècnica, correus electrònics, plànols d’enginyeria, models CAD, dades històriques i anys de coneixement expert. En aquesta sessió explorarem com diferents tecnologies d’intel·ligència artificial —LLMs, visió artificial, IA multimodal i sistemes de suport a la decisió— es poden integrar en processos existents per reduir temps de resposta, millorar la consistència i augmentar la capacitat operativa. A través d’un cas real del sector metal·lomecànic mostrarem què és possible avui, quines limitacions existeixen i quins aprenentatges hem obtingut en portar aquestes solucions a producció.

The post 13.20h a 13:50hMés enllà dels models de llenguatge: els models multimodals appeared first on AI Congress.


Artículo de marta.pla publicado en https://aicongress.barcelona/es/13-20h-a-1350hmes-enlla-dels-models-de-llenguatge-els-models-multimodals/