BIG DATA

Comment tirer profit du Big Data

 

Toujours soucieux de répondre à vos problématiques documentaires, CD-DOC s’associe à SEMDEE pour vous proposer une nouvelle solution d’exploitation de l’information.

A l’heure du Big Data, les solutions SEMDEE permetttent aux entreprises de mieux dimensionner leurs besoins d’informations en fonction de leurs problématiques métiers.

Avec 80% de données non structurées (source : Gartner juin 2015), les entreprises sont de plus en plus nombreuses à s’interroger sur la meilleure manière d’exploiter le potentiel de ces données. Qu’elles soient issues d’ e-mails, des solutions ECM ou GED, des RSE, des applications CRM, de portails collaboratifs, de fichiers textes ou tout simplement d’Internet, ces données représentent un véritable enjeu économique.

La bonne utilisation de ces informations en entreprise conditionne désormais :

  • La réactivité de l’entreprise,
  • La capacité à prendre la bonne décision en connaissance de cause,
  • La compétitivité et la connaissance des marchés,
  • La productivité et l’efficacité des intervenants,
  • La capitalisation, la réutilisation et la transmission des savoirs internes,
  • L’augmentation de la connaissance individuelle qui est le préalable à l’intelligence collective

Au vue des volumes de contenus trop importants, provenant de sources variées et en perpetuelle évolution, il est difficile pour les collaborateurs de l’entreprise de mobiliser la connaissance nécessaire.

C’est a ce stade que SEMDEE, solution technologique issue d’un rapprochement entre le monde de la psychologie cognitive et celui de l’intelligence artificielle intervient pour faciliter l’analyse de données textuelles et automatiser la production de connaissances.

SEMDEE propose d’industrialiser certaines étapes de la cognition humaines comme : la synthèse, la corrélation, la déduction, la classification etc… à partir de ses API (Application Programming Interfaces) facilement et rapidement utilisables dans votre environnement.

Nos API et leurs exemples d’utilisation

CRAWL : récupération / import de données à partir d’une source externe (ECM, GED, RSE, CRM, CMS, Internet etc…)

Exemple : organiser une veille sur internet au sujet des «actions gouvernementales» afin de réaliser une revue de presse automatique et router automatiquement le contenu par e-mail.

PERSONALIZED CONTENT : reconnaissance du type de contenu utilisé habituellement par une personne afin de lui router du contenu sélectionné et approprié

Exemple : router divers contenus aux différentes personnes d’un service en fonction des documents qu’ils ont déjà consultés

ALERT : Capacité à reconnaitre la description d’une situation ou d’un évènement dans un corpus et à déclencher une alerte.

Exemple : si dans les contenus récupérés il apparait qu’une « action gouvernementale » a fait largement augmenter le chômage, vous disposez de l’information pour envisager une action immédiate.

CATEGORIZER : Classification automatique des contenus dans des catégories définies et redéfinissables en permanence par chaque utilisateur.

Exemple : un utilisateur veut recevoir ses contenus classés automatiquement par « action gouvernementale », un autre veut les recevoir par catégories relatives à chaque ministère.

PROFILER : distinction et sélection d’interlocuteurs en fonction des verbatims émis par chacun

Exemple : le responsable de la communication du ministère des sports veut créer des groupes d’internautes susceptibles d’être proches en termes de discours afin de s’adresser à eux de manière ciblée.

MONITORING : Synthèse et regroupement de documents selon les sujets abordés. Accès a un ou plusieurs documents appartenant au thème.

Exemple : comptabilisant l’ensemble des mails reçus et des documents récupérés sur internet l’utilisateur dispose d’une vision synthétique de 100.000 contenus.

LONG SEARCH : Recherche sémantique à partir d’une formulation élaborée (une phrase, un paragraphe, un texte en entier). Capacité à rechercher des idées, des concepts, des problématiques.

Exemple : Après avoir accédé à un document sur « l’action gouvernementale » un chargé de communication a besoin d’une information plus détaillée. Il fait donc un copier/coller de deux paragraphes pour trouver une information plus précise

RELATED CONTENT : Proposition, suggestion de contenus connexes et complémentaires susceptibles d’intéresser l’utilisateur sans que celui ci n’ait formulé de requête spécifique.

Exemple : après avoir accédé a un document traitant du « droit des patients » l’utilisateur se voit proposer d’autres documents sur « le renforcement de la prévention » ou « la réorganisation des soins de proximité ». Il peut alors naviguer de proche en proche jusqu’a ce qu’il se voit un document suggéré particulièrement pertinent.

TAGGER : Création automatique de « Tags » représentatifs du contenu pour améliorer l’indexation ou la lisibilité.

Exemple : lorsque l’utilisateur a trouvé son document qui comporte dix paragraphes, un nuage de mots lui donne un aperçu de ce qu’il est censé trouver dans ce contenu. Il peut alors décider s’il souhaite véritablement investir 5 à 10 minutes sur la lecture du document.