2009-04-21 12 views
1

Comment Informatica gère-t-il les sources de données non structurées telles que PDF? Si un rapport tabulaire est stocké en tant que PDF, peut-on le lire à partir d'un PDF sous la forme de données tabulaires (comme une table de données dans .NET)?PDF Source des données dans Informatica

Répondre

0

PDF est en fait assez structuré en interne. Des révisions plus récentes de la spécification PDF peuvent fournir un moyen de conserver les données pour un traitement externe, mais l'objectif principal des documents PDF est de décrire un document pour l'impression, afin que tous les types d'environnements et de périphériques puissent imprimer le document avec un résultat similaire possible.

Il dépend en grande partie du créateur du PDF si des données supplémentaires sont fournies, à l'exception de l'endroit où imprimer le texte et les lignes pour former une table.

2

Informatica PowerCenter Unstructured Data Option

drôle que vous mentionnez, je travaillais pour l'entreprise de démarrage qui a inventé la technologie sous-jacente, jusqu'à ce que l'acquisition avec Informatica.

0

Vous devez utiliser le produit d'échange de données Informatica B2B qui gère les données non structurées. Ce produit offre des fonctionnalités pour gérer toutes sortes de données non structurées, non seulement PDF, mais aussi Word, Excel, Star Office, AFP, PostScript, PCL et HTML. Vous devez utiliser Informatica B2B Data Transformation.

Voici un lien rapide pour votre référence.

http://www.informatica.com/us/products/b2b-data-exchange/b2b-data-transformation/