Saltar a contenido

Calidad de los datos

驴Qu茅 es la calidad de los datos?

La calidad de los datos se refiere a la precisi贸n, confiabilidad y coherencia de los datos. En el contexto de la Especificaci贸n general de alimentaci贸n de bicicletas compartidas (GBFS), garantizar una alta calidad de los datos es esencial para proporcionar a los usuarios informaci贸n precisa y confiable sobre los sistemas de movilidad compartida. La mala calidad de los datos puede generar confusi贸n y una experiencia de usuario disminuida. Por lo tanto, es fundamental comprender qu茅 significa la calidad de los datos y c贸mo mantenerla. No existe una definici贸n universal de calidad de datos, sin embargo tratamos de cumplir con tres principios fundamentales cuando hablamos de calidad de datos.

Un conjunto de datos de alta calidad es:

Completo: Los campos y elementos para describir la La informaci贸n obligatorio est谩 completamente completa. Puntos de bonificaci贸n por completar campos y campos opcional .

Preciso: la informaci贸n contenida en el conjunto de datos es verdaderamente representativa del estado del servicio en el mundo real.

Actualizada: la informaci贸n es verdaderamente representativo del servicio en el momento de uso obligatorio .

Un conjunto de datos de alta calidad es importante porque:

La gente ver谩 el servicio: Diferentes consumidores tienen diferentes umbrales de calidad. Un conjunto de datos de mayor calidad tiene m谩s probabilidades de aparecer en una variedad de aplicaciones de planificaci贸n de viajes, lo que aumenta el alcance del servicio.

La gente confiar谩 en el servicio: cuando falta informaci贸n o es inexacta, la experiencia se vuelve m谩s dif铆cil . Si la informaci贸n se vuelve consistentemente poco confiable, el pasajero comenzar谩 a considerar otras opciones.

Todos los pasajeros ser谩n atendidos por igual: Los pasajeros merecen opciones confiables seg煤n sus necesidades (accesibilidad, costo, modo, etc.). Los datos completos permiten representar todos los aspectos de un servicio de movilidad compartida en una aplicaci贸n de planificaci贸n de viajes.

驴C贸mo puedo asegurarme de que los datos que recibo/produzco sean de alta calidad?

Como productor:

Como productor productor de datos, su funci贸n es proporcionar datos GBFS precisos y confiables. A continuaci贸n se detallan algunos pasos clave para garantizar una alta calidad de los datos:

  1. Validaci贸n de datos: implemente procesos de validaci贸n rigurosos para detectar y corregir errores en sus datos antes de compartirlos con los consumidores. Esto incluye verificar si faltan datos, son incorrectos o inconsistentes. Puede verificar la validez de sus datos GBFS con la especificaci贸n utilizando el Validador can贸nico GBFS.
  2. Actualizaciones peri贸dicas: aseg煤rese de estar utilizando la versi贸n oficial m谩s reciente de los datos GBFS. La versi贸n actual se puede encontrar en la p谩gina Referencia o en el Repositorio GBFS en Github. Adem谩s, mantenga sus datos date para reflejar el estado actual del mundo real de su sistema de movilidad compartida. Esto es lo que establece GBFS con respecto a latencia de datos: >Los datos devueltos por los puntos finales casi en tiempo real station_status.json y vehicle_status.json DEBEN ser lo m谩s cercanos al tiempo real posible, pero en ning煤n caso deber铆a tener m谩s de 5 minutos de desfase. Los valores apropiados DEBEN establecerse utilizando la propiedad ttl para cada punto final en funci贸n de la frecuencia con la que se actualizan o actualizan los datos de los feeds. Para puntos finales casi en tiempo real donde los datos siempre deber铆a actualizarse, el valor ttl DEBE ser 0. La timestamp last_updated representa el conocimiento que tiene el editor del estado actual del sistema en este time. La timestamp last_reported representa la 煤ltima time que una estaci贸n o vehicle inform贸 su estado al backend del operador.

  3. Documentaci贸n: puede confiar en la documentaci贸n existente para informar su creaci贸n de conjuntos de datos GBFS, como la documentaci贸n referencia en s铆, nuestras diversas publicaciones de blog de lanzamiento (que se encuentran aqu铆), o nuestra Gu铆a de implementaci贸n de GBFS para productores. Si tiene alguna idea para mejorar la documentaci贸n existente o crear nueva, h谩ganoslo saber en sharedmobility@mobilitydata.org.

  4. Mecanismo de retroalimentaci贸n: Establecer un mecanismo para que los consumidores informen problemas con los datos. Esto puede ayudar a identificar y rectificar problemas de calidad de datos r谩pidamente. Para los datos GBFS, esto significa proporcionar un feed_contact_email activo en el punto final system_information.json. Puede agregar su feed_contact_email a la lista de MobilityData a continuaci贸n.

Como consumidor:

Los consumidores de datos GBFS conf铆an en la informaci贸n proporcionada para mostrar una variedad de opciones de movilidad compartida a sus usuarios. A continuaci贸n le explicamos c贸mo puede garantizar la calidad de los datos al utilizar datos GBFS:

  1. Validaci贸n de datos: implemente la validaci贸n de datos por su parte para verificar anomal铆as o inconsistencias en los datos que recibe. Puede verificar la validez de sus datos GBFS con la especificaci贸n utilizando el Validador can贸nico GBFS.
  2. Datos de referencia cruzada: compare los datos de GBFS con otras fuentes confiables para verificar su precisi贸n.
  3. Mant茅ngase informado: mant茅ngase date con las actualizaciones y revisiones de GBFS y aseg煤rese de utilizar la versi贸n oficial m谩s reciente de los datos de GBFS. La versi贸n actual se puede encontrar en la p谩gina Referencia o en el Repositorio GBFS en Github. Comprender los cambios en el formato de los datos puede ayudarle a adaptarse a cualquier modificaci贸n.
  4. Proporcione comentarios: si identifica problemas de calidad de los datos, inf贸rmelo al productor de datos utilizando el campo feed_contact_email que se puede encontrar en el punto final system_information.json o en la lista siguiente. Sus comentarios pueden contribuir a la mejora de los datos.

Como regulador:

Los reguladores desempe帽an un papel vital en la supervisi贸n de la calidad de los datos en la industria de la movilidad compartida. Para mantener altos est谩ndares, considere lo siguiente:

  1. Establecer est谩ndares de calidad de datos: exigir datos GBFS de alta calidad, en la forma de la versi贸n oficial m谩s actualizada y hacer cumplir umbrales de calidad para los productores de datos GBFS. Esto puede ayudar a garantizar una calidad de datos uniforme en toda la industria. Para obtener m谩s informaci贸n sobre c贸mo require datos GBFS, lea nuestra Gu铆a de pol铆ticas GBFS.
  2. Auditor铆a y cumplimiento: audite peri贸dicamente a los productores de datos para verificar el cumplimiento de la especificaci贸n GBFS; puede hacerlo utilizando el Validador can贸nico de GBFS. Fomentar la transparencia y la rendici贸n de cuentas.
  3. Educaci贸n del usuario: Educar a otros reguladores sobre qu茅 esperar de los datos del GBFS y c贸mo identificar problemas de calidad. Esto puede empoderar a los reguladores para tomar decisiones informadas.
  4. Participe: participe en debates sobre el avance de la especificaci贸n GBFS en el canal GBFS Slack de MobilityData o en el repositorio Github para mantenerse actualizado sobre todos los nuevos cambios en la especificaci贸n para estar preparados para aceptar la 煤ltima versi贸n de GBFS.

Garantizar una alta calidad de datos en GBFS es una responsabilidad compartida y, al seguir estas pautas, podemos colectivamente Proporcionar a los usuarios informaci贸n fiable y precisa sobre los sistemas de movilidad compartida. La calidad de los datos no solo mejora las experiencias de los usuarios, sino que tambi茅n respalda el crecimiento y la sostenibilidad de los servicios de movilidad compartida.

驴C贸mo puedo marcar un error en un conjunto de datos?

Para marcar un problema en un conjunto de datos, utilice feed_contact_email que se encuentra en system_information. json o en la siguiente tabla. Al marcar un problema, aseg煤rese de incluir el campo y los archivos que crean el problema, y 鈥嬧媍贸mo se presenta este problema en su aplicaci贸n.

Rastreador de correo electr贸nico de contacto de feed mantenido por MobilityData:

El rastreador de correo electr贸nico de contacto de feed es una herramienta mantenida por MobilityData para monitorear el estado de las direcciones de correo electr贸nico de contacto de feeds que se encuentran en el punto final system_information.json en feeds GBFS. El objetivo es garantizar que los consumidores y los reguladores puedan se帽alar problemas de calidad de los datos a la direcci贸n de correo electr贸nico correcta. MobilityData confirmar谩 la actividad de estas direcciones de correo electr贸nico trimestralmente.

Agregar un correo electr贸nico de contacto al feed