Le monde est surchargé d’informations. Les scientifiques de l’Université Ben Gourion aideront les gens à surmonter cette situation avec une méthode automatisée et indépendante de la langue pour résumer les textes.
Selon le professeur Mark Last, qui a aidé à inventer la nouvelle technologie, «les gens essaient d’avaler tellement d’informations et cela fait gagner du temps aux lecteurs. Ils n’ont pas à passer beaucoup de temps à lire un long article, ils peuvent aller droit au but. »
Il a travaillé pour la dernière fois avec le Dr Marina Litvak et le Dr Menachem Friedman.
Plus précisément, BGN Technologies, la société de transfert de technologie de BGU, a introduit un nouvel outil automatisé et indépendant de la langue pour résumer les textes applicables à l’extraction d’articles, de magazines et de bases de données dans les médias eux-mêmes et par les utilisateurs desdits médias. Les utilisateurs peuvent être des organisations professionnelles, telles que des bibliothèques ou des moteurs de recherche universitaires, ou des particuliers.
Les résumés de texte sont basés sur un algorithme génétique qui, selon une déclaration, classe les phrases des documents selon les caractéristiques statistiques des phrases.
« Nous calculons un ensemble de mesures statistiques pour chaque phrase du document ». Ensuite, l’algorithme attribue un poids à chaque métrique. Sur la base de ce poids, l’algorithme calcule l’importance de chaque phrase du document. Les phrases sont réorganisées et l’utilisateur reçoit un résumé à partir duquel il peut décider de son intérêt .
L’ensemble du processus est automatisé.
« Certains sites Web d’actualités, comme le New York Times, présentent un bref résumé ou les faits saillants de chacun de leurs articles », a déclaré Last. «À ma connaissance, ces résumés sont faits manuellement aujourd’hui. Notre méthode peut le faire automatiquement. »
Encore plus unique, le système fonctionne dans au moins neuf langues: anglais, hébreu, arabe, persan, russe, chinois, allemand, français et espagnol. Sa qualité de résumé a déjà été évaluée dans quatre de ces langues: l’anglais, l’hébreu, l’arabe et le persan présentent un haut niveau de similitude avec les résumés générés par les êtres humains.
Le premier rapport sur la méthode a été publié par l’équipe en 2010. Depuis, elle n’a cessé d’affiner le système. Aujourd’hui, »les gens sont très satisfaits des résultats ».
Zafrir Levy, vice-président du développement commercial chez BGN Technologies, a déclaré qu’après avoir déposé un brevet pour protéger l’invention, BGN Technologies est maintenant à la recherche d’un partenaire industriel pour le développement futur de la technologie.
« Nous recherchons actuellement des partenaires potentiels pour le développement et la commercialisation de cette invention prometteuse », a déclaré Levy.
[signoff]