mardi 27 septembre 2016

Blog Universdoc ... suite

Une nouvelle promotion va intégrer le 3 octobre prochain la formation de Chef de projet en ingénierie documentaire et gestion des connaissances de l'INTD-Cnam.
Le blog UniVersDoc va donc reprendre du service et nos élèves, un peu fébriles au début mais toujours aussi pertinents, vont s’atteler à vous livrer leurs billets de veille toutes les semaines jusqu'en juin 2017.

Cette mise en situation professionnelle se renouvelle depuis 2009 et trouve un écho toujours grandissant auprès des professionnels.

Pour prolonger cette démarche de veille informative, nous vous proposons d'exploiter le portail documentaire de l'INTD http://portaildoc-intd.cnam.fr/. Un espace personnalisable vous y attend.






N’hésitez pas à nous contacter pour plus d'information : crd@cnam.fr









Adriana Lopez Uroz

mardi 17 mai 2016

Surfez sur le Web avec Vivaldi.


Il est bien connu que la musique adoucit les mœurs. Pour autant quand on parle de Vivaldi, on ne se réfère pas ici au célèbre compositeur des quatre saisons mais bien à un navigateur récemment développé par Jon Von Tetzchner [3] et son équipe. Qu'apporte-il vraiment aux utilisateurs ? Quelle position par rapport à Firefox ou Google Chrome ?

D'Opéra à Vivaldi, il n'y a qu'un pas.

L'histoire de Vivaldi se relate à celle d'Opéra. En effet, développé en 1994, Opéra avait pour objectif, "d'être un navigateur rapide, capable de fonctionner sur un matériel peu puissant tout en gardant à l'esprit que chaque utilisateur était différent avec des besoins propres'' [1]. 

Au fil du temps et à mesure que la communauté d'Opéra s'agrandissait, d'autres objectifs ont vu le jour. Afin de répondre aux nouveaux besoins des utilisateurs, l'équipe d'Opéra, s'est mis à développer un nouveau navigateur doté de nombreuses fonctionnalités [1 et 2].




Vivaldi : une gamme de fonctionnalités.

Faire une recherche pour trouver des réponses est le principe même de n'importe quel moteur de recherche. Proposer des fonctionnalités sympathiques afin de rendre son utilisation plus agréable et ergonomique aux yeux de l'utilisateur est encore mieux.

Vivaldi, au delà d'une navigation rapide (exemple : les speed dial qui permettent par des liens rapides et visuels d'avoir accès à nos sites préférés, accessibles à partir de chaque nouvel onglet [1]) et intelligente (possibilité de prise de notes pendant la navigation et copie d'écran), offre en autre à l'utilisateur : 
  • Une gestion avancée des onglets (sous forme de session, de pile d'onglets ou la capacité de restaurer les onglets supprimés).
  • Des signets (par des barres ou en lui attribuant un surnom).
  • Une personnalisation de l'apparence pour rendre la navigation plus agréable aux yeux des utilisateurs (colorisation de l'interface, zoom de la page etc). 
Très prometteur et accessible gratuitement, Vivaldi peine cependant à gagner des parts de marchés bien occupé par Google Chrome et Firefox [2] mais nul doute que ses nombreuses fonctionnalités et sa simplicité font faire parler de lui et permettre aux mordus du Web d'accéder à une source de connaissances riche autre que Google.

1. ECHOSDOC. Vivaldi : nouveau navigateur. In Blog Logiciels Documentaires [en ligne]. 17/05/2016. (Consulté le 17/05/2016). Disponible sur : http://www.echosdoc.net/2016/05/vivaldi-nouveau-navigateur/

2. PIRAINA, Alexis. Tour d'Horizon de Vivaldi, le navigateur des powers users. In Blog Numérama [en ligne]. 07 Avril 2016. (Consulté le 17/05/2016). Disponible sur : http://www.numerama.com/tech/161438-tour-dhorizon-de-vivaldi-le-navigateur-des-power-users.html

3. VIVALDI (NAVIGATEUR WEB). In Wikipédia. (Consulté le 17/05/2016). Disponible sur : https://fr.wikipedia.org/wiki/Vivaldi_%28navigateur_web%29



mercredi 4 mai 2016

Fin de la Hadopi en 2022 ?

Est-ce fini pour Hadopi ? Durant la nuit du jeudi 28 au vendredi 29 avril, on a voté à l'Assemblée nationale pour la suppression de la Hadopi en février 2022. C’était dans le cadre de l'examen d’une proposition de loi sur le statut des autorités administratives indépendantes (AAI) et des autorités publiques indépendantes (API). [1]

Pour rappel, Hadopi est la haute autorité pour la diffusion des œuvres et la protection des droits sur internet. Elle est issue d'une loi du 12 juin 2009 [2] suivie par une loi du 28 octobre 2009 [3].
Elle a quatre missions imposées par le législateur :
  • La protection des œuvres sur internet (riposte graduée)
  • L'encouragement au développement de l'offre légale présentée sur son site OffreLegale.fr
  • La régulation des DRM et autres mesure de protection des droits
  • La labellisation de moyens de sécurisation

Juridiquement parlant, elle ne sanctionne pas le fait de copier ou de partager des œuvres en ligne, mais le fait pour l'internaute de ne pas avoir empêché que son accès à internet soit utilisé pour pirater.
En effet, elle a été créée principalement pour mettre en oeuvre la riposte graduée ou "réponse graduée". C'est une procédure qui vise d'abord à avertir l'internaute par mail puis par courrier recommandé pour le prévenir qu'il risque une sanction (au maximum une amende de 1500 euros) s'il continue à pirater sur internet. [4]

Au total, Hadopi a coûté 59.72 millions d'euros de subventions de l'Etat depuis sa mise en route en 2010. Ceci dit, le piratage n'a pas davantage diminué en France que dans les autres pays et la procédure n'a abouti qu'à 7 condamnations prononcées pour plus de 6.5 millions de courriels envoyés [5].

C'est pourquoi le web s'emballe depuis l'adoption de l'amendement qui supprimera l'institution Hadopi. Cependant, il n'en va pas de même pour la riposte graduée. Et cela pour plusieurs raisons :
  • Seule la première sous-section du code de la propriété intellectuelle [6], qui intitulée "compétences, composition et organisation", sera supprimée le 4 février 2022. Les trois autres sont conservées.
  • On pourra facilement transférer la riposte graduée à une autre autorité administrative comme le CSA ou l'ARCEP par exemple
  • Le Sénat pourra annuler la disposition lors de son examen de la proposition de loi
  • Enfin, la prochaine majorité à l'Assemblée nationale aura cinq ans jusqu'à 2022 pour voter un amendement qui supprimera l’article qui supprime Hadopi [7].
L'affaire n'est donc pas close et la fin de l'institution n'est en rien celle de la loi. 


Sources :

[1] Alain Beuve-Mery. « Hadopi : et si la partie s’arrêtait le 4 février 2022 ? ». [En ligne]. 30 avril 2016. [Consulté le 4 mai 2016]. http://www.lemonde.fr/economie/article/2016/04/30/hadopi-et-si-la-partie-s-arretait-le-4-fevrier-2022_4911356_3234.html



[4] Guillaume Champeau. « Hadopi : une FAQ pour tout savoir ». [En ligne]. 18 avril 2016. [Consulté le 4 mai 2016]. http://www.numerama.com/politique/129728-hadopi-faq-savoir.html

[5] Guillaume Champeau. « D’ici sa mort en 2022, la Hadopi aura coûté plus de 100 millions d’euros ». [En ligne]. 29 avril 2016. [Consulté le 4 mai 2016]. http://www.numerama.com/politique/167402-budget-hadopi.html

[6] « Legifrance.gouv.fr ». [En ligne]. Version consolidée au 25 avril 2016. [Consulté le 4 mai 2016]. https://www.legifrance.gouv.fr/affichCode.do?cidTexte=LEGITEXT000006069414

[7] Guillaume Champeau. « Non, la loi Hadopi ne va pas mourir ». [En ligne]. 29 avril 2016. [Consulté le 4 mai 2016]. http://www.numerama.com/tech/167495-non-loi-hadopi-ne-va-mourir.html

Les "biens communs" vont-ils réussir à s'émanciper ?

Les "biens communs" sont des ressources ni privées ni publiques, mises à disposition dans une dynamique collective, pour être partagées suivant certaines règles d'accès et d'usage.
L'enjeu est de transmettre les connaissances acquises au plus grand nombre, tout en conservant un environnement informationnel intègre, dans lequel les droits de chacun sont respectés, ce qui sous entend une politique responsable au niveau mondial, européen et national.
Ce défi constitue aujourd'hui une nécessité dans la démarche d'innovation de la recherche scientifique, mais n'a toujours pas abouti à un consensus en France.


La libre circulation de l'information : réduction des inégalités ?
Le numérique, vecteur naturel des "biens communs", ouvre la voie à la profusion de l'information, sans coût apparent, et à des pratiques sociales de partage généralisé.
Le but est de faciliter la réutilisation, ce qui implique de rendre les données accessibles, intelligibles, fiables et interopérables, et donc dans des modèles standards [1].
Cette ouverture s'inscrit cependant dans un monde "réel", avec ses disparités technologiques, législatives, ses divergences de moyens et de taille d'acteurs, et des finalités mises en jeu différentes. La communication de Ghislaine Chartron et Evelyne Broudoux [2] détaille ainsi ces différentes "asymétries" mondiales et la contradiction qui existe entre la disponibilité offerte et sa concrétisation finale.

Zoom sur les données de la recherche
Des initiatives locales au sein des organismes de recherche sont prises pour encadrer le mouvement de "science ouverte" (open science), comme celle du Comité consultatif commun d'éthique Inra-Cirad [1]. L'objectif est d'organiser et de coordonner les décisions et actions de manière centralisée, permettant l'accès ouvert aux données scientifiques des administrations publiques. Le respect des conditions de préparation des données afin de les standardiser en est la clé.
Le projet DoRANum (Données de la Recherche: Apprentissage NUMérique à la gestion et au partage) du réseau des Urfist et de la Bibliothèque Scientifique Numérique propose quant à lui un dispositif de formation des professionnels de l'information, y compris les chercheurs, afin d'acquérir les bonnes pratiques de valorisation des données mises à disposition du public [3].

Quelle politique nationale ?
Au cœur de l'amendement de l’article 18 bis de la loi numérique de début 2016, le "Text and data mining" ou TDM, permet de donner à l'information sa dimension de "bien commun" pour Savoircom1 [4]. L'ambition est de mettre à disposition dans le domaine public le contenu des corpus scientifiques "en licence Creative Commons « Zéro » CC0".
Pour les défenseurs de TDM, il est primordial pour la France de se rallier à des pays tels que les États-Unis, le Canada, le Japon et la Grande-Bretagne au sein d'une loi qui autorise la fouille automatique des données scientifiques, et ainsi aider les avancées de la recherche grâce aux "analyses et découvertes contenues dans ces productions scientifiques" [5].
Dans sa publication [6], Ghislaine Chartron relate et analyse l'historique et les enjeux soulevés par l'open access, et en particulier l'open science, et met l'accent sur la difficulté en France à trouver un compromis concernant les conditions de diffusion de contenus relevant de droits d'auteurs et du Code de la Propriété Intellectuelle.

Les débats vont-ils aboutir à un consensus ?
Le rapport récent aux ministres chargés de la Culture et de l’Enseignement supérieur sur la « Mission Text and Data Mining » rédigé par Charles Huot, président du Groupement Français de l’Industrie et de l’Information (GFII) a eu pour effet de déclencher la démission des principaux organismes membres de recherche publics.
Son objectif était d'accorder les différentes parties prenantes concernant les modalités et le périmètres des contenus autorisés à être extraits et réutilisés.
L'association EPRIST juge les positions prises comme allant à l'encontre du progrès scientifique, sans mise en marche de la France dans le mouvement européen en matière de droit, donc déconnectées de l'intérêt général et ne répondant pas aux attentes [5].
Le texte remanié du projet de Loi pour une République numérique va être examiné au sénat à la fin du mois d’avril puis fera l’objet d’un dernier vote à l’Assemblée Nationale le 5 mai [4]. Les compromis accordés sont un premier pas vers l'ouverture pour certains, afin que la société en bénéficie pleinement au final.

Va t'on enfin réussir à concilier la protection des communs et la garantie de leur essence même, celle du partage ?

Creative commons CC0 [7]


Sources :

[1] Cirad.  La Recherche Agronomique pour le Développement : "Ethique | Le partage et la gestion des données issues de la recherche" [en ligne]. 11 avril 2016. [consulté le 4 mai 2016]. cirad.fr.
http://www.cirad.fr/actualites/toutes-les-actualites/articles/2016/ca-vient-de-sortir/ethique-le-partage-et-la-gestion-des-donnees-issues-de-la-recherche.
[2] Ghislaine Chartron, Evelyne Broudoux. CCSD - Archive Ouverte en Sciences de l'Information et de la Communication : "Enjeux géopolitiques des données, asymétries déterminantes" [en ligne]. 19 avril 2016. [consulté le 4 mai 2016]. ccsd.cnrs.fr.
http://archivesic.ccsd.cnrs.fr/sic_01304035.
[3] Réseau des URFIST. Urfistinfo : "DoRANum BSN: des ressources de formation et d’auto-formation sur les données de la recherche" [en ligne]. 11 février 2016. [consulté le 4 mai 2016]. urfistinfo.hypotheses.org/.
http://urfistinfo.hypotheses.org/tag/donnees-de-la-recherche.
[4]  Savoircom1 : "Pour une véritable exception text mining dans la Loi sur le numérique!" [en ligne]. 22 avril 2016. [consulté le 4 mai 2016]. savoirscom1.info.
http://www.savoirscom1.info/2016/04/pour-une-veritable-exception-text-mining-dans-la-loi-sur-le-numerique/?utm_source=feedburner&utm_medium=feed&utm_campaign=Feed%3A+Savoirscom1+%28SavoirsCom1%29&utm_content=Netvibes
[5] Thérèse Hameau. Site d'information sur les données de la recherche : "« Mission Text and Data Mining » : beaucoup de bruit pour rien…" [en ligne]. 21 avril 2016. [consulté le 4 mai 2016]. donneesdelarecherche.fr.
http://www.donneesdelarecherche.fr/spip.php?article817
[6] Ghislaine Chartron. CCSD - Archive Ouverte en Sciences de l'Information et de la Communication : "Stratégie, politique et reformulation de l’open access" [en ligne]. 19 avril 2016. [consulté le 4 mai 2016]. ccsd.cnrs.fr.
http://archivesic.ccsd.cnrs.fr/sic_01304045
[7] Image du domaine public [en ligne]. 24 avril 2015. [consulté le 4 mai 2016]. Pixabay.
https://pixabay.com/photo-735787/

vendredi 15 avril 2016

Panama papers : mode d'emploi

Le 3 avril 2016, les médias du monde entier ont publié les premiers résultats de 9 mois d’investigation internationale à partir d’une fuite (leak) sans précédent. Les Panama papers contiennent les transactions enregistrées de 1977 à 2015  par le cabinet d’avocats panaméen Mossack Fonseca spécialisé dans la domiciliation de sociétés-écrans. Soit 2,6 téraoctets de données pour 11,5 millions de documents, 1000 fois plus que les câbles diplomatiques publiés par wikileaks en 2010.
Comment les 370 journalistes associés à l’enquête coordonnée par l’International Consortium of Investigative Journalists (ICIJ) ont-ils fait pour traiter efficacement une telle masse documentaire si rapidement ?


Dé-dupliquer, extraire le texte brut, indexer
Déjà utilisée pour exploiter les données de l’Offshore Leaks mis au jour par l’ICIJ en 2013, la technologie Nuix a permis de dé-dupliquer les documents sauvegardés plusieurs fois, d'extraire le texte par reconnaissance optique et de mettre à disposition cette source reformatée via un moteur de recherche. (1)

Visualiser et explorer toutes les relations possibles
La base de données de graphes Neo4j et la plateforme de data-visualisation développée par la start-up française Linkurious ont été associées pour offrir aux enquêteurs un outil puissant mais intuitif. Cette solution a été décisive pour comprendre les liens entre les sociétés, les intermédiaires, les actionnaires et leurs adresses. (2)

Systématiser les recherches
Pour établir la liste du millier de français actionnaires de l'une des société offshore l’équipe data du Monde a recouru à 3 méthodes d’exploitation des données :
•    harmonisation des adresses issues du registre interne des sociétés de Mossack Fonseca via le logiciel OpenRefine
•    recherche par lots à partir de listes de personnalités
•    recherche par expressions régulières sur les IBAN des comptes bancaires ou les codes d’identification des passeports

Prospecter pour combler les lacunes
En dernière instance les data-journalistes n'ont pu mener une analyse exhaustive du leak (notamment la vérification des identifications suggérées par un algorithme d'association) et ont concentré leurs efforts sur la recherche d’informations complémentaires, quitte à en passer par le téléphone voire… le fax. (3)

Sources :
(1) Guillaume Serries, Big Data / Panama Papers : déduplication et OCR pour donner du sens à l'énorme masse de données, ZDNet.fr, 05/04/2016 : <http://www.zdnet.fr/actualites/big-data-panama-papers-deduplication-et-ocr-pour-donner-du-sens-a-l-enorme-masse-de-donnees-39835136.htm>

(2) Antoine Crochet- Damais, Linkurious met la visualisation de graphes à la portée des analystes, Journal du net, 08/07/2014 : <http://www.journaldunet.com/solutions/saas-logiciel/linkurious.shtml>

(3) Jérémie Baruch et Maxime Vaudano, « Panama papers » : un défi technique pour le journalisme de données, data blog Le Monde.fr, 08/04/2016 : <http://data.blog.lemonde.fr/2016/04/08/panama-papers-un-defi-technique-pour-le-journalisme-de-donnees/>

Pour aller plus loin sur la fabrique des Panamas papers, et notamment la dimension collaborative de l'enquête :
Cécile Prieur, « Panama papers », la révolution du journalisme collaboratif, LeMonde.fr, 13/04/2016 : <http://www.lemonde.fr/panama-papers/article/2016/04/13/panama-papers-la-revolution-du-journalisme-collaboratif_4901183_4890278.html#u2RPkg566EuoryAt.99>

Tous les liens dirigent vers des articles en accès libre, consultés le 15/04/2016

lundi 11 avril 2016

L’intelligence artificielle s’invite au salon Documation



Buzzword ou véritable levier de croissance pour les entreprises ? Le sujet de l’intelligence artificielle a réuni entrepreneurs, juristes et chercheurs lors du dernier salon Documation.

La dernière édition du salon Documation (salon de la gestion du contenu et du document), qui s'est tenu les 6-7 avril dernier, était placée sous le signe de l'intelligence artificielle. De la fouille de données au désormais bien connu robot-journaliste, en passant par le récent "échec réussi" (1) du chatbot Tay de Microsoft ou encore la détection d'épidémies, les applications de l'IA sont nombreuses et parfois fascinantes.
"Depuis 60 ans, pas une discipline n'a autant changé le monde que l'intelligence artificielle ! Voyez l'hypertexte et les moteurs de recherche qui ont été développés grâce à elle" (2), explique l'expert en IA Jean-Gabriel Ganascia de l'université Pierre et Marie Curie, présent à la conférence Entreprise : l'âge de l'intelligence artificielle.
En matière d'IA la question juridique ne tarde pas à arriver sur la table. C'est le sens de l'intervention de l'avocat Alain Bensoussan lors de la conférence déjà mentionnée. Qui assume, par exemple, la responsabilité du dérapage du chatbot Tay (intelligence apprenante qui a très vite tenu des propos condamnables sous la mauvaise influence de quelques interlocuteurs mal intentionnés) ? L'IA peut-elle se retrouver sur le banc des accusés ? Ou la faute retombe-t-elle sur le concepteur ? Sur l'entreprise ? Sur l'usager ? Quelle serait la responsabilité juridique de la Google Car en cas d'accident ? Maître Bensoussan, par ailleurs Président du réseau Lexing (premier réseau international dédié au droit des technologies avancées), estime qu'il est urgent de penser le droit des robots, en faveur duquel il milite à travers son Association du droit des robots.
En attendant le monde avance et les grandes entreprises se sont déjà saisies de l'IA, qu'elles intègrent dans leur fonctionnement. Les services rendus sont nombreux : mieux personnaliser la relation-client, analyser plus finement et décrypter plus rapidement les exigences du marché ou encore créer des produits et services innovants (3). Le "Big Data" serait-il déjà passé de mode ?

Sources :


(2) Texier Bruno, L'Entreprise passe à l'âge de l'IA, Archimag.

lundi 4 avril 2016

L'alliance Creative commons et Blockchain : pour le meilleur et pour le pire ?

Dans un précédent billet*, j’annonçais que la Blockchain était certainement une technologie à suivre tant ses applications potentielles pouvaient être variées… Je reviens donc sur cette thématique avec une application à priori imprévue de la Blockchain dans le domaine culturel.







À l’ère du partage sans frontières et de l’échange de données, la sécurisation qu’offre ce grand registre sécurisé qu’est la Blockchain*, devrait intéresser les détenteurs d’œuvres numériques ; la Blockchain pourrait apporter une solution au problème des artistes et créateurs d’œuvres numériques ou numérisables. En effet, aujourd’hui, l’accès à la culture se fait majoritairement via Internet notamment pour la musique, à la fois sur des plateformes gratuites et payantes.

En 2015, sur les 6 premiers mois de l'année, Internet a représenté 43% environ de l'ensemble du marché français de la musique. Un an plus tôt, c'était 35%. Et ce en grande partie en raison du développement du streaming payant (+65,9%) selon les chiffres du SNEP*.
En dépit de cette grande part d’Internet, la rémunération des artistes continue de s’effectuer selon le modèle traditionnel des majors et sociétés en noms collectifs comme la SACEM.

La Blockchain peut initier ici une véritable révolution, puisqu’elle peut apporter des moyens techniques capables d’assurer la traçabilité d’une œuvre et de ses usages et de mettre en place des paiements automatisés via une cryptomonnaie (comme Bitcoin). La rémunération des ayants-droits s’effectuerait directement et ne serait plus aux mains d’intermédiaires. 
On voit ainsi la chanteuse Imogen Heap avec son morceau Tiny Human, tester le potentiel de traçabilité et de rémunération de la Blockchain avec la start-up UjoMusic, qui utilise la Blockchain Ethereum.

Dans ce contexte, on comprend l’initiative de Creative Commons France, qui a lancé un partenariat avec le service Ascribe.io en mai 2015 pour permettre aux créateurs d’enregistrer leurs œuvres sous licence Creative Commons et leurs conditions de licence via le protocole Blockchain.
On peut ainsi (selon Creative Commons France) :
« 1. Enregistrer votre œuvre sur le blockchain, accompagnée de votre nom et d’autres informations relatives à l’œuvre.
2. Enregistrer les conditions de la licence Creative Commons choisie.
3. Établir l’antériorité de votre œuvre (en cas de litige).
4. Suivre les utilisations qui sont faites de votre œuvre pour s’assurer de leur concordance avec la licence choisie. »
Cependant, ce rapprochement entre Creative Commons et protocole Blockchain, peut interroger. En effet, les principes de libre partage, de divulagtion au plus grand nombre qui ont guidé la création des licences Creative Commons, sont-ils en danger ?
La technologie Blockchain va certes permettre la traçabilité et protéger les droits et les intérêts des ayants droits, mais du point de vue des usagers, la « surveillance » qu’elle inclut va t-elle initier une alliance finalement pour le pire de Creative Commons et Blockchain ?
Voilà, un aspect qu’il faudra creuser et suivre dans les temps à venir.



RESSOURCES



-       *Blockchain, voir cette excellente vidéo très didactique :
La « blockchain » expliquée à ta belle-mère en moins de trois minutes

-       Imogen Heap La chanteuse qui veut révolutionner l'industrie musicale – Les Échos

-       *Chiffres clés du marché français de la musique sur Internet

-       Ascribe sur Creative Commons

-       Logo Creative Commons

Dernière consultation des liens : 04 avril 2016