política de cookies

Utilitzem cookies per a facilitar l'ús de la nostra pàgina web.

Les cookies que utilitzem no emmagatzemen cap dada personal, ni cap mena d'informació que pugui identificar-li. En cas de no voler rebre cookies, si us plau configuri el seu navegador d'Internet perquè les esborri del disc dur del seu ordinador, les bloquegi o li avisi en cas d'instal·lació d'aquestes. Per a continuar sense canvis en la configuració de les cookies, simplement continuï en la pàgina web. En visitar la nostra pàgina web, accepta la instal·lació d'aquestes cookies en el seu dispositiu.

x
Bitendian logo

Reconeixement ultraràpid de matrícules ferroviàries amb IA eficient i maquinari assequible

Desafiament

Els operadors ferroviaris necessiten identificar a l’instant cada tren que passa per motius logístics, de seguretat i de traçabilitat. Fins ara, llegir una matrícula en moviment era lent: l’OCR convencional amb prou feines arribava a un fotograma per segon (fps). A Bitendian hem resolt aquest coll d’ampolla combinant dos especialistes d’IA—un detector ultraràpid i un OCR d’alta precisió—dins d’una sola canalització que ofereix 80 fps amb una modesta NVIDIA GeForce GTX 1050 Ti.

El desafiament rau en què els trens, en circular a velocitats de fins a 80 km/h, deixen només mil·lisegons per capturar una imatge nítida. A això s’hi afegeix la il·luminació inconsistent a les andanes i la vibració constant, fet que complica encara més l’obtenció d’imatges de qualitat. A més, el pressupost de hardware és limitat, ja que una mateixa GPU ha d’alimentar múltiples tasques de visió.

Solució

La solució de Bitendian, composta per 4 passos, es basa en una arquitectura optimitzada i eficient que permet identificar matrícules ferroviàries en temps real:

  1. Es realitza una localització ultraràpida de la matrícula utilitzant YOLOv11n (ajustat), entrenat amb unes 100 imatges etiquetades específicament per a aquest propòsit, aconseguint detectar la placa en menys de 3 mil·lisegons.

  2. Mitjançant OpenCV amb suport CUDA, es fa un retall intel·ligent que extreu únicament la regió d’interès (ROI) proporcionada pel detector.

  3. S’aplica un sistema d’OCR basat en models Transformer, que en condicions normals triga uns 0,9 segons per fotograma complet, però que en operar sobre la ROI retallada redueix el temps a uns 8 mil·lisegons.

  4. S’implementa un procés de validació mitjançant expressions regulars i un sistema de checksum intern, que filtra els falsos positius i assegura que el resultat compleixi amb el format específic de les matrícules ferroviàries.

La clau de l’èxit d’aquest enfocament rau en què l’OCR només s’activa quan el detector identifica una placa, descartant la resta dels fotogrames en qüestió de microsegons.

Resultats

Els resultats obtinguts demostren un rendiment notable:

  • El sistema assoleix 80 fotogrames per segon de forma sostinguda amb una GPU GTX 1050 Ti.

  • La precisió del reconeixement és del 99,2 % en condicions de llum diürna i del 97,8 % durant la nit utilitzant il·luminació infraroja.

  • La solució s’integra fàcilment com a complement mitjançant una REST API, cosa que permet reutilitzar les càmeres de vigilància existents sense necessitat de modificar la infraestructura.

Aquesta solució ofereix múltiples beneficis per al client:

  • Permet una traçabilitat instantània, ja que cada tren queda registrat en el moment exacte en què passa pel punt de control.

  • Redueix significativament el CAPEX, en no requerir GPUs d’alta gamma gràcies a l’alta eficiència del programari.

  • Garanteix escalabilitat, ja que és possible incorporar nous conjunts d’imatges i reentrenar el detector per adaptar-lo a altres flotes o regions sense grans canvis en la infraestructura.

Properes passos

Els següents passos se centren a continuar optimitzant i expandint la solució. Es preveu millorar el rendiment nocturn mitjançant l’ús de dades sintètiques infraroges per augmentar la robustesa del sistema en condicions de baixa il·luminació. A més, es preveu el desplegament en dispositius edge, específicament amb Jetson Orin Nano, cosa que permetrà eliminar la dependència d’un PC central i reduir encara més els costos i la latència. Finalment, s’està treballant per ampliar les capacitats del sistema per detectar si els vagons estan plens o buits, reutilitzant la mateixa canalització ja implementada per al reconeixement de matrícules.

T’interessa aquest tema? Contacta amb nosaltres a info@bitendian.com o visita la nostra pàgina de contacte