2010-11-05 33 views
4

J'ai utilisé une solution commerciale pour les distances et les temps de parcours pour l'Amérique du Nord et l'Europe de l'Ouest/Mid. J'envisage d'étendre le projet à d'autres pays - et peut-être au monde entier. Un budget très limité et une couverture régionale inégale provenant de fournisseurs commerciaux individuels rendent probablement OpenStreetMap hébergée localement la seule option viable. Avant que quelqu'un ne propose une solution en ligne, mon application nécessite beaucoup de calculs intensifs - quelque chose qui coûterait cher ou serait très impoli (et probablement interdit) s'il est effectué en utilisant un service web. Les résultats des calculs sont remis dans le domaine public, de sorte qu'ouvrir OpenStreetMaps n'est pas un problème.Évaluation d'OpenStreetMap pour le routage international

Mon problème est de savoir comment évaluer la couverture des données de routage pour les différents pays dans la base de données OpenStreetMap? Une telle évaluation pourrait déterminer si le projet est viable et un ordre approprié pour le traitement (c'est-à-dire faire d'abord les pays avec la meilleure couverture).

Les fournisseurs de données commerciales haut de gamme peuvent généralement fournir des descriptions statistiques, ainsi que des descriptions régionales de la couverture étudiée. OpenStreetMap est beaucoup plus inégal - une zone comprend généralement certaines routes, mais pas toutes les routes. Des erreurs de localisation individuelles de quelques mètres, même de 10 à 20 mètres, ne poseront aucun problème pour mon application (je regarde les distances entre la ville et la ville), mais la connectivité du graphe de route l'est. C'est à dire. les vecteurs routiers doivent logiquement se rencontrer correctement à un carrefour.

Est-ce que quelqu'un a tenté de créer des statistiques décrivant la couverture de données de la base de données OpenStreetMap?

Si non, comment procéderiez-vous? Le meilleur que je peux penser est de prendre un échantillonnage aléatoire de lieux (par exemple villes), puis tenter de calculer les itinéraires. Il faudrait supposer que les routes principales auront tendance à être ajoutées avant les routes secondaires. Par conséquent, une route entre deux villes éloignées utiliserait la route principale logique, et non une route secondaire (qui est généralement plus longue/plus lente) parce que la route principale est manquante.

Un autre problème serait qu'il est physiquement impossible de conduire entre plusieurs villes. Souvent, cela est dû à la présence d'îles (où les traversiers pourraient être utilisés) mais souvent, il n'y a pas de route de surface (par exemple, des établissements au Nunavut). Alors, comment ces statistiques seraient-elles utilisées lorsqu'on compare entre (par exemple) les Tonga et l'Afghanistan? L'Afghanistan a probablement une couverture de données très faible. Tonga est probablement meilleur mais les colonies sont dispersées à travers un archipel.

Quelques détails sur mon application: Tous les points de début et de fin sont des villes et des villes dont les emplacements proviennent de la base de données Geonames. Typiquement, je regarde les 1000 plus grandes villes dans un pays qui ont aussi une population d'au moins 1000. Les routes sont actuellement calculées en double comme les routes les plus rapides et les routes les plus courtes. Les vitesses de route raisonnables varient en fonction des grandes catégories de routes. Les temps de trajet estimés sont calculés aux côtés des distances de route. Ces détails sont des préférences pour la cohérence - ils ne sont pas gravés dans la pierre.

Répondre

5

Il y a un certain nombre d'initiatives pour décrire la qualité des OpenStreetMap, mais ils sont tous limités à une zone spécifique. Muki Haklay a fait des recherches approfondies sur la qualité des données d'OpenStreetMap. De nombreux résultats quantitatifs concernent le Royaume-Uni. His blog est une ressource de choix si vous souhaitez en savoir plus sur la qualité d'OpenStreetMap en général - ce qui est beaucoup plus qu'une simple complétude des données. Here est son évaluation de l'exhaustivité d'OpenStreetMap au Royaume-Uni. A comparable study has been done for Germany (PDF) récemment.Le fait est que, pour mesurer l'exhaustivité, vous avez besoin d'un ensemble de données de référence exact à mesurer. Vous pouvez utiliser les données TeleAtlas ou NAVTEQ pour cela, mais ce sont des données coûteuses et ces entreprises ne communiquent pas leurs données à des fins de recherche. Les données du gouvernement peuvent également convenir, mais ne sont pas toujours disponibles ou, comme c'est le cas aux États-Unis par exemple, désespérément dépassées et inexactes. En fait, OpenStreetMap a lancé l'effort de cartographie américain avec une énorme importation de TIGER, un ensemble de données qui n'a jamais été conçu pour le routage/la navigation et qui est un désordre de topologie. Les volontaires sont working hard pour améliorer ces données, mais leur progression est lente. Si vous souhaitez vous lancer dans la création de statistiques quantitatives de qualité, le mieux est de vous engager auprès de la communauté OpenStreetMap pour en savoir plus sur le modèle de données et voir comment il correspond à ce que vous essayez de faire. Qu'est-ce qui constitue les «données de routage»? Les routes et les itinéraires de ferry eux-mêmes, évidemment. Tournez les restrictions? Des vitesses maximales? Qualité de la route? Grades? Le OpenStreetMap help forum serait probablement un bon point de départ. Je suppose que, avec un budget limité, vous devrez faire beaucoup d'hypothèses pour atteindre une couverture mondiale.

HTH

+0

Merci pour les liens - c'est plus dans le sens de ce que je pensais. J'avais réfléchi à la façon dont les fournisseurs commerciaux devaient mesurer leurs statistiques, mais je l'excluais de ma question qui était déjà un peu longue (je suppose qu'ils regardent les corrections quand ils ré-enquêtent et puis en extrapolent des statistiques plus larges). Pour les mesures OSM, vous parlez de comparer avec des données inférieures (par exemple TIGER/Line) ou des données commerciales (données de classe I de l'I comme commercial, ici!). Le dernier type de défaites la raison de mon utilisation de données OSM. – winwaed

+0

Je pense que les erreurs topologiques (par exemple la connectivité correcte), les attributs (vitesses moyennes) et l'existence sont les principales erreurs potentielles qui m'inquiètent. Les erreurs de quelques mètres (ou même jusqu'à 100 m) sont beaucoup moins problématiques car je calcule les distances de route d'une ville à l'autre. Souvent, avec les réseaux commerciaux, je vois des différences directionnelles d 'un mile en raison des systèmes à sens unique, des routes de façade, etc. – winwaed

+0

Je vais attribuer la prime à cette réponse - c'est la plus proche de ce que je cherchais. Bien qu'il y ait du travail dans la région, cela semble être un problème difficile - et une faiblesse de l'approche OSM. Les géomètres commerciaux peuvent comparer les erreurs/changements détectés lors des ré-enquêtes et estimer une erreur à partir de ces derniers. OSM ne peut pas faire cela. – winwaed

5

Vous obtiendrez probablement une meilleure gamme de réponses à plus https://gis.stackexchange.com/questions

+0

Merci je n'étais pas au courant de son existence. Je viens de m'inscrire et je vais poster un message. – winwaed

+0

juste pour la référence: http://gis.stackexchange.com/questions/3394/assessing-openstreetmap-coverage-for-international-routing – Karussell