00000001.jpg

CHERCHER

Accueil Actualités Dépêches Coup de projecteur Manifestations Contact

Technologies de la Langue

Imprimer cet article

  Moteurs de recherche de brevets et analyse sémantique
vendredi 22 juin 2007


Aujourd’hui, les brevets ne sont plus seulement utilisés dans les services juridiques et de R&D. En effet, un directeur financier peut être amené à réaliser une recherche dans une base de données de brevets pour évaluer la valeur du portefeuille de brevets d’une entreprise avant de l’acquérir. De la même façon, un responsable du développement commercial devra lui aussi conduire ce type de recherches s’il souhaite acquérir des licences afin d’étendre le portefeuille des produits de son entreprise. Plus généralement, suivre l’apparition des nouveaux brevets de ses concurrents, vérifier l’état de l’art antérieur avant de lancer un projet, ou encore veiller à la protection de son propre portefeuille représentent autant d’impératifs pour les entreprises.

Les enjeux financiers d’une recherche efficace sur l’état de l’art antérieur, étape préliminaire au lancement d’un projet, sont énormes, et ce d’autant plus que les investissements sont élevés. Le principal objectif de cette recherche est double : limiter les risques de violation de brevets existants et vérifier préalablement au dépôt d’un brevet qu’aucun brevet similaire n’a été déposé afin de ne pas risquer l’invalidation. Dans certains cas, les brevets sont rédigés de façon à passer inaperçus afin que son propriétaire puisse réclamer de fortes indemnités pour violation de brevets.

Les brevets sont mis à disposition gratuitement par les offices de propriété industrielle, tels que :
-   le United States Patent and Trademark Office
-   l’Office Européen des Brevets
-   l’Office de la propriété intellectuelle du Canada
-   le World Intellectual Property Organization

Le site web du Patent Information Users Group propose une liste très complète des sites web des différents offices de brevets dans le monde.

Il est également possible de rechercher des brevets sur des moteurs de recherche dédiés à cet usage parmi lesquels figure Google Patent search, qui permet de rechercher parmi les 7 millions de brevets de l’USPTO dont l’antériorité remonte à 1790. Les résultats de la recherche sont triés par pertinence grâce aux algorithmes de recherche avancée de Google. On peut aussi utiliser EspaceNetpour rechercher sur le site de l’OEB. Ce site rend accessible 50 millions de brevets et demandes de brevets. On peut enfin avoir recours à Freepatentonline.

Les moteurs de recherche de brevets gratuits sont très utiles pour une première approche d’un sujet. Cependant, dès que l’on souhaite mener une recherche plus approfondie, il est préférable de recourir aux banques de données de brevets payantes qui disposent de possibilités de recherche plus avancées, mais surtout des documents relatifs aux brevets et demandes de brevets dans la perspective d’une recherche de l’état de l’art antérieur efficace. Parmi ces banques de données on peut citer, de manière non exhaustive, Derwent de Thomson, LexisNexis, Delphion, Micropatent, ou encore Minesoft.

Ces banques de données proposent soit une recherche booléenne soit une recherche reposant sur la sémantique, parfois les deux. Nous nous intéresserons en particulier aujourd’hui aux banques de données de brevets qui se sont récemment orientées vers une stratégie de recherche basée sur la sémantique.

Ainsi, Lingway et Questel ont conclu un partenariat technologique afin de développer Lingway e-Patent (LEP), en collaboration avec FIST, filiale du CNRS et d’Oséo. Il s’agit d’un moteur de recherche spécialisé dans l’information en propriété intellectuelle qui sera disponible d’ici à la fin de l’année. Cette solution repose sur le text mining et l’analyse sémantique et permettra l’extraction automatique des informations stratégiques des brevets disponibles sur Questel.

Par ailleurs, une nouvelle version de la base de données internationale de brevets de PatentCafe, riche de 25 millions de documents relatifs aux brevets - utile lors de la recherche de l’état de l’art antérieur - ainsi que 12 millions de brevets et du moteur de recherche Semetric a été annoncée dernièrement. Ce moteur de recherche se positionne sur le marché comme une alternative à la recherche booléenne et permettrait de trouver plus rapidement et plus efficacement les brevets pertinents à côté desquels passeraient les moteurs de recherche booléens. En effet, les requêtes formulables en langage naturel peuvent compter jusqu’à 4000 mots. Le moteur est basé sur « l’analyse sémantique latente » qui est un procédé statistique de traitement automatique des langues permettant d’établir des relations conceptuelles entre un ensemble de documents et les termes qu’ils contiennent. Cette méthode utilise également les réseaux de neurones, de sorte que le logiciel est capable « d’apprendre ». Cela signifie que des brevets qui ne comportent pas les termes utilisés dans la requête pourront donc tout de même apparaître dans les résultats. , PatentCafe V 2.5 apporte ainsi son aide pour la veille technologique, avant le lancement d’un projet, mais également pour la protection et le renforcement des portefeuilles de brevets existants.