RENSEIGNEMENTS
Tel : 06 83 10 82 97
e-mail: mdr at irif.fr
Michel de Rougemont

edit SideBar

Expertise

Le cours présentera les bases de l'expertise en Informatique. On distinguera l'expertise pénale et l'expertise civile et on décrira les principales techniques d'analyse et de prédictions de données.

  • PEN: Expertise Pénale (13,5h)
    • L'expertise Pénale en Informatique est demandée par un juge à un Expert Judiciaire en Informatique dans le cadre d'une instruction au sein des juridictions pénales (tribunaux correctionnels par exemple).
    • L'expert doit analyser les données provenant de disques durs, de systèmes d'Information et de Réseaux sociaux pour répondre aux questions posées par le juge. Préparation d'un prérapport pour une analyse contradictoire et d'un rapport final.
    • Statistiques des données (streaming et datawarehouse), Test de propriétés basés sur les statistiques. Paradoxe des anniversaires, Reservoir sampling, Datawarehouse streaming, Graph Streaming, détails
      • Données de Texte (Grep)
      • Base de données SQL et noSQL (Jpivot)
      • Réseaux sociaux (Twitter)
    • Expertise Pénale: les juridisctions
    • Evaluation: l'évaluation se fait sur un projet. Il s'agit de rendre un prérapport d'expertise (avant le cours 5), puis un rapport d'expertise (1 semaine après le cours 5) en répondant aux questions du juge à partir des données fournies dans les fichiers auxiliaires. A rendre en binôme. Questions:
      • Quelle est la liste des emails des fichiers .txt et .docx, sous forme d'histogramme?
      • Quelle est la liste des URLs du fichier.txt, sous forme d'histogramme?
      • Quelle est la nature de l'entreprise décrite par la Base de données Monmagasin.sql? (Analyses OLAP en dimension 1,2 et 3 pour la Bases de Données LesAchats)
      • Quelle est la trace d'un mot clé sur Twitter? Capture Twitter sur un ou des mots clés. Montrer comment analyser des communautés. Utiliser le fichier .gephi par défaut ou une capture Twitter.
      • Présenter le rapport sous-forme de réponses aux questions d'un juge.
  • CIV: Expertise Civile (13,5h)
    • L'expertise civile concerne les tribunaux d'Instance ou de Commerce pour régler un litige entre plusieurs parties. L'expert est désigné par un juge qui pose des questions précises. Il organise des réunions, propose un pré-rapport et intègre les remarques de chaque partie dans son rapport final qui répond aux questions du juge. Des dommages sont très souvent à prendre en compte.
    • Le cours insiste sur la partie Modélisation (méthode Merise) et Prévision à partir de données, pour mieux comprendre les données, la responsabilité des parties et les dommages potentiels.
    • Modélisation: la méthode MERISE distingue schémas de données MLD, schémas de traitement MLT. Niveau logique et niveau physique. Schéma directeur, Etude préalable, Etude technique, Production et Maintenance. Protection des données personnelles (RGPD Site EU de la RGPD).
    • Prévisions à partir des données: DataMining, Apprentissage supervisé et non supervisé à partir d'un entrepôt de données et de réseaux sociaux. Evaluation des dommages. Textmining.
    • Sujets et techniques utilisées:
      • Schémas de données et schémas de traitement.
      • Arbre de décision avec Dtree et Weka (fichier achats.csv et/ou fnum.csv ou équivalent)
      • Régression linéaire avec Weka (fichier achatsnum.csv ou équivalent)
      • Régression logistique avec Weka (fnum.csv ou équivalent)
      • Clustering avec 2 ou 3 classes
      • Textmining: analyse Word2Vec. Exemple: texte de 4 phrases (avec les mots A,B,C,D,E): "ADC. ADE. DBC. EBC." Donner la matrice (3,3) de corrélations pour A,B,C. On peut en déduire 3 vecteurs de dimension 2 qui approchent cette corrélation.
    • Support détaillé: Polycopié
    • Cadre général pour le projet: La société PB exploite un site marchand. Elle demande sa rénovation à la société en communication SC qui a sous-traité la construction à la société informatique SI. Suite à des retards et à une perte de confiance, la société PB a annulé le contrat de 1M, après avoir payé 500k. La société SC assigne au tribunal de commerce la société PB et demande le paiement global du contrat. La société PB demande le remboursement des 500k et des indemnités de 2M pour perte d'exploitation.
    • Evaluation: Rendre un prérapport d'expertise (avant le cours 5) puis un rapport d'expertise (en binome, pas de trinome) à partir des données fournies dans les fichiers auxiliaires ci-dessous (ou équivalents) et répondre aux questions du juge ci-dessous. Le point de départ est l'ensemble des documents fournis par les parties, (à imaginer partir des Spécifications partielles ).
      • Q1: Expliquer les dysfonctionnements supposés du site imaginé par SC et construit par SI. Distinguer la fiabilité du serveur, des logiciels et des interfaces Client.
      • Q2: Evaluer la structure de la base de données (LesAchats, LesClients, LesProduits ci-dessous dans le fichier MonMagasin.sql) en fonction des spécifications sur les données et sur les traitements.
      • Q3: Estimer les responsabilités des trois acteurs dans les dysfonctionnements observés.
      • Q4: Donner un avis sur les dommages demandés par les deux parties. La note finale prendra en compte la présence aux cours.
  • Fichiers Auxiliaires (PEN et CIV)
  • Exemples Word2vec à partir des statistiques des moments: Demo Word2vec
  • L'Informatique dans le Master EEJSI
  • Les langages de programmation
UP2