RENSEIGNEMENTS
Tel : 06 83 10 82 97
e-mail: mdr at irif.fr
Michel de Rougemont

edit SideBar

Option Informatique

  • IPRO - OPTION INFO – Réseaux et Applications, Course manager Michel de Rougemont (135)
     Référence cours Mining Massive Data Sets,
     Livre Mining Massive Data Sets.
  • Algorithmes et Complexité (P, NP, BPP): MaxNP, Optimisation sur les graphes,
  • Graphes Aléatoires: Erdos-Renyi, Attachement Préférentiel, Distribution des degrés. Exemple: la distribution des degrés [15,6,4,3,3,2] avec 33 noeuds et 39 arêtes. Génération d'un graphe avec un matching aléatoire et avec un matching concentré.
  • Algorithmes randomisés d'approximation: correcteur arithmétique, distance entre objets. Exemple: estimer la taille du graphe à partir de r échantillons. Si on tire selon le degré, on calcule R=D1+D2-r où D1 est la somme des degrés, D2 est la somme des inverses des degrés. On calcule aussi C comme le nombre de collision. Alors le nombre de noeuds n est proche de R/C.
  • Données de streaming: e1,.....ei,..... arêtes d'un graphe. On ne stocke pas tout le graphe. Combien de communautés? Réservoir, Priority sampling.
  • Evaluation: Graphes, Communautés, Streaming. Le but est de montrer comment reconnaitre des communautés d'un graphe social (graphe Twitter) à partir d'un flux d'arêtes. Un petit sous-ensemble d'arêtes peut suffire. Le but est de comprendre l'impact de ces analyses sur la corrélation de flux. On prendra l'analyse de cryptomonnaies (Bitcoins, Ethereum, Ripple....) comme exemple. La présence aux cours comptera pour l'évaluation.
  • Sécurité des données RGPD
    • PIA
    • Questions juridiques, réponses techniques
  • Projet à rendre:
    • 1. Montrer des graphes ER avec n=20, p=0.2 et p=0.05. Qu'observe-t-on?
    • 2. Construire un graphe G ayant 2 communautés à partir de deux distributions de degrés concentrées avec n=66 noeuds (a1,....ai et b1...bi) et du bruit ER (noeuds c1,....ci). Environ 200 arêtes en tout.
    • 3. Avec GEPHI: suivre un flux à intervalles réguliers. Afficher les variations des composantes géantes. Est-ce que la distribution des degrés du graphe réservoir est stable?
    • 4. Capter un flux Twitter avec le programme Python Github/TD2. Comparer les composantes géantes avec celles obtenues à la question 3. Y-a-t-il une corrélation avec un autre flux, par exemple les variations du cours bitcoin?
UP2