Named-Entities son strings que hacen referencia a un único objeto reconocible en el discurso en todos los mundos posibles. Si bien, desde la filosofía analítica del lenguaje se estudió la forma en que el lenguaje puede hacer referencia a estos objetos o personas únicos con formas “comunes” (lo que se conoce como descripciones definidas “el mejor jugador del mundo en el mundial de fútbol de 1986“), en general, en la tarea estándar de la lingüística computacional, se entiende que las named-entities son nombres propios en sentido estricto. La dificulatd radica en que los usuarios del lenguaje no siempre respetan la convención de mayúsculas/minúsculas para referirse a ellos.

Este prototipo reconoce entidades de nombre propio, incluyendo aquéllas escritas en mayúsculas, minúsculas, con prefijos o sufijos de honoríficos, etc. También lleva a cabo una clasificación de dichas entidades, reconociendo nombres geográficos (Locations, LOC), personas (PER), organizaciones   (ORG), o entidades desconocidas (UNK).

Nuestro prototipo cuenta con un mecanismo de aprendizaje, de modo que si una entidad desconocida fue ingresada en letras mayúsculas, se guardará también su versión en letras minúsculas para futuros reconocimientos aprendidos.

Ud. puede ingresar un texto plano completo o subir un archivo de texto de grandes dimensiones para ser procesado.

Algunos ejemplos que pueden ser reconocidos como named entity son: Eduardo VI, Salón de Mujeres del Bicentenario, diego maradona, Dr. Frankenstein, etc.

Pruébalo aquí

http://labs.socialmetrix.com:3333

 

Fernando Balbachan

Diego Dell’Era

Socialmetrix Labs