Recientemente comencé a trabajar en tecnologías de datos vinculados. De lo que aprendí, puedo entender qué es y cómo publicarlo, pero ¿por qué lo necesitamos?

Es importante porque hoy Internet está compuesta en gran parte de documentos no estructurados, es decir, cosas que las máquinas no pueden inferir como hechos. Los datos vinculados dan a los documentos un verdadero significado en forma de metadatos estructurados. Esto es genial porque los productos ya no se ven retenidos por una mala anotación.

Por ejemplo, la diferencia entre una ‘mención pasajera’ de una compañía en una historia, frente a una historia que trata sobre esa compañía es un factor importante en la búsqueda de la recuperación de información muy relevante.

Con datos estructurados, se pueden recorrer y consultar diferentes conjuntos de datos para revelar respuestas que le tomarían a un humano muchas horas / días / semanas o incluso meses para investigar. P.ej

• ¿Cuántos parlamentarios conservadores tienen “conexiones” con cualquier “oficial” de “compañías” en la “industria” de “bebidas”?
• ¿Cuántos “británicos” menores de 40 años han sido “diagnosticados con” “cirrosis hepática”?
• ¿Qué “auto familiar” “por debajo de £ 20k” tiene la “calificación” NCAP “más alta”?
• ¿Qué “evidencia científica” existe que muestre un “vínculo” entre “aspartamo” y “tumores cerebrales”?

Por supuesto, solo porque puedes hacerlo, no significa que siempre debas hacerlo (¡aunque probablemente deberías hacerlo!).

En última instancia, se reduce al valor futuro percibido que una empresa cree que puede derivar de los datos vinculados frente al costo de implementación, etc.