Dev/code review #6

bertrandlalo · 2020-05-01T14:47:50Z

Hello la team ETL :) @cl3m3nt , @rcourivaud

J'ai fait pas quelques refactoring, en appliquant es corrections détaillées dans cette issue.

Pour résumer :

Changement de forme

Réorganisation du repo

J'ai essayé de faire du tri dans tous les codes, et ce que je propose comme orga du repo, c'est :

/data avec des échantillons de données d'entrées possibles (pour les tests)
/etl qui contient l'ETL principale et les utilitaires dans un paquet /etl/utils
docs: avec la docs (source & build)
/tests: qui contiendra les tests unitaires
/wip_devel: avec les notebooks & co. Pour l'instant azure est dedans.

PEP 8 et doc-string

J'ai appliqué les changements nécessaires pour répondre aux standards Python
La doc-string est de type 'numpy' et nous permet de générer de la jolie doc avec Sphinx
J'ai essayé de compléter le README avec les infos qui manquaient

Pandas

J'utilise des DataFrame pandas, qui nous permettent d'avoir accès à pleins d'utilitaires cool. Par exemple, les données GPS ont maintenant cette tête là :

                               latitude   longitude  elevation
  2018-01-24 19:27:58+00:00  33.126515 -117.327168    -17.228
  2018-01-24 19:27:59+00:00  33.126543 -117.327153    -18.199
  2018-01-24 19:28:12+00:00  33.126616 -117.325690    -18.440
  2018-01-24 19:28:13+00:00  33.126540 -117.327072    -19.161
  2018-01-24 19:28:14+00:00  33.126539 -117.327218    -18.472

Misc

Print -> Logs
Camel case -> lower
ajout de requirements.txt et environment.yml pour faciliter l'installation
ajout de setup.py pour utiliser ce repo comme un paquet via pip install git+..., pas besoin de tout cloner)
sphinx doc à build avec make html, qui ressemble à :

[source](https://github.com/surfriderfoundationeurope/etl/tree/dev/code-review/docs/source) [build](https://github.com/surfriderfoundationeurope/etl/tree/dev/code-review/docs/build) à compléter !

Optimisations

correction/optimisation de fillGPS
La fonction fillGPS me semblait compliquée et sujet à erreurs (par ex, si le GPS et la vidéo commencent ou finissent pas ensemble). Puis, j'ai réalisé que les seuls points qui nous intéressaient étaient en fait ceux où il y a un déchet détecté. Donc, au lieu d'interpoler toutes les données manquantes du fichier GPS, je n'interpole que les données dont le timestamp correspond à un déchet détecté par l'IA (cf mon point correction de trashGPS ci-après).
changement d'ordre pour FAIL le plus tôt possible (sanity checks)
Par ex, c'est dommage de faire un call à l'IA si à la fin la connection à la DB échoue. ou si on n'arrive pas à extraire les données GPS du fichier.
J'ai enlevé le script shell qui faisait appelle à une commande juste pour avoir la durée du média, et j'ai remplacer par une fonction python.
J'ai remplacé l'appel par ligne de commande à goproToGPx pour utiliser le paquet Pypi de Raph. D'ailleurs @rcourivaud , comment je fais pour fixer un truc sur le paquet ? (je trouve pas ton repo)
J'ai implémenté un CLI pour lancer l'ETL depuis le shell. C'est peut être un peu plus pratique que le parseargs (je trouve) et on le lance avec etl [OPTIONS]

Nouvelles features

Correction du `trashGPS`

On n'utilisait pas l'information 'frame_to_box' donnée par l'IA, qui donne le numero de la frame sur laquelle se trouve le trash. Etant donné que tu as aussi le fps et la durée, à partir du timestamp de début, on peut retrouver le timestamp du trash. Confirmé avec la team MOT (@charlesollion ), cf explication ici et fix là.
Du coup, ça permet d'optimiser la fonction qui prenait longtemps pour estimer les géométrie (X, Y, Z) ) partir de (latitude, longitude) car celle ci ne loop que sur les lignes où y a des déchets.

Accepte les entrées de type Smartphone vidéos et Manuelles

L'hypothèse faite ici, c'est qu'il y a 4 types de source d'acquisition possibles et que les fichiers GPX associés aux médias portent le même nom (@AntoineBruge, ok?) :

gopro: fichier foo.mp4
smartphone video: fichier foo.mov + fichier foo.gpx (@AntoineBruge , quelles autres extensions ?)
smartphone photo: fichier foo.jpg + fichier foo.gpx
-manuelle: fichier foo.gpx

NB1: La sortie de la version manuelle est légèrement différente:

colones pour les sorties gopro et smartphones : ['time', 'longitude', 'latitude', 'elevation', 'id', 'label', 'box', 'frame', 'geom']
colones pour les sorties manuelles : [time', 'longitude', 'latitude', 'label', 'geom']

NB2: Les labels des données manuelles sont différents :
{'Objet vie courante', 'Bouteille boisson', 'Peche et chasse', 'Autre dechet', 'Industriel ou construction', 'Emballage alimentaire', 'Dechet agricole', 'Autres dechets +10'}

Pour tester ça en local, vous pouvez faire (après avoir activé l'environnement, cf README.rst) :

pour les données manuelles :

etl --data-source local --media sample.gpx  --data-dir  data/osm_tracker/ --target-storage local

pour les données gopro:

etl --data-source local --media sample.mp4  --data-dir  data/gopro/ --target-storage local

pour les données smartphone vidéos:

etl --data-source local --media sample.mp4  --data-dir  data/smartphone_video/ --target-storage local

Données smartphone photo : @AntoineBruge, si t'as un exemple de GPX associé à une photo ?

Pouvoir travailler 100% en local (sans se connecter à Azure & Postgre)

En fait, quand on veut tester ou développer, c'est pratique de ne pas être dépendant de Postgre et de Azure. Donc tu verras, j'ai essayé de documenter, mais dans la commande pour lancer l'ETL, on peut choisir de travailler avec des données locales plutôt que de télécharger depuis Azure (on pourra comme ça imaginer à l'avenir télécharger depuis d'autres sources). Pareil pour la sortie, on peut choisir de sauver le résultat en CSV localement plutôt que de l'insérer dans la base de données.

Todo, next steps

Voir comment télécharger un seul fichier du blob
Voir comment noter que l'ETL a déjà tourné sur un média, si ça a SUCCESS ou FAIL, ainsi que sa version, celle de l'IA.
Quelques fix dans le paquet de @rcourivaud qui extrait les données GPX
Ajout de tests unitaires
Prévoir les migrations de la base de données
Question: Est-ce qu'on peut rediscuter ce qu'on doit insérer dans la base de données ? J'ai peur qu'il manque quelques infos.
Tester l'image docker, car je suis pas hyper sûre de moi (@rcourivaud)
Porter sur Azure fonction

Qu'en dites vous ?

++

AntoineBruge · 2020-05-04T15:41:32Z

Salut tout le monde, Merci Raph pour ton mail. Tu as fait un travail monstre ! Pour répondre à tes questions : il n’y a que 3 sources d’acquisition possible -> * gopro: fichier foo.mp4 (données GPS intégrées au .mp4) * smartphone video depuis l’app Plastic Origins (en développement) : fichier foo.mov + fichier foo.gpx * Données manuelle depuis l’app Plastic Origins : fichier foo.gpx (incluant la trace GPS + des waypoints correspondant aux déchets) Les données GPS seront toutes stockées dans le format GPX. C’est le format qui nous semble être (merci Clément) le plus standard et facile à manier. On en parle demain 😉 Bonne aprem Antoine From: Raphaëlle Bertrand-Lalo <notifications@github.com> Sent: vendredi 1 mai 2020 16:48 To: surfriderfoundationeurope/etl <etl@noreply.github.com> Cc: Surfrider Antoine Bruge <abruge@surfrider.eu>; Mention <mention@noreply.github.com> Subject: [surfriderfoundationeurope/etl] Dev/code review (#6) Hello la team ETL :) @cl3m3nt<https://github.com/cl3m3nt> , @rcourivaud<https://github.com/rcourivaud> J'ai fait pas quelques refactoring, en appliquant es corrections détaillées dans cette issue<#5>. Pour résumer : Changement de forme Réorganisation du repo J'ai essayé de faire du tri dans tous les codes, et ce que je propose comme orga du repo, c'est : * /data avec des échantillons de données d'entrées possibles (pour les tests) * /etl qui contient l'ETL principale et les utilitaires dans un paquet /etl/utils * docs: avec la docs (source & build) * /tests: qui contiendra les tests unitaires * /azure: qui contiendra les images docker & co ? (pas sûre de l'emplacement, @rcourivaud<https://github.com/rcourivaud> ?) * /wip_devel: avec les notebooks & co. PEP 8 et doc-string * J'ai appliqué les changements nécessaires pour répondre aux standards Python * La doc-string est de type 'numpy' et nous permet de générer de la jolie doc avec Sphinx * J'ai essayé de compléter le README avec les infos qui manquaient Pandas * J'utilise des DataFrame pandas, qui nous permettent d'avoir accès à pleins d'utilitaires cool. Par exemple, les données GPS ont maintenant cette tête là : · latitude longitude elevation · · 2018-01-24 19:27:58+00:00 33.126515 -117.327168 -17.228 · · 2018-01-24 19:27:59+00:00 33.126543 -117.327153 -18.199 · · 2018-01-24 19:28:12+00:00 33.126616 -117.325690 -18.440 · · 2018-01-24 19:28:13+00:00 33.126540 -117.327072 -19.161 · · 2018-01-24 19:28:14+00:00 33.126539 -117.327218 -18.472 · Misc * Print -> Logs * Camel case -> lower * ajout de requirements.txt et environment.yml * sphinx doc à build avec make html, qui ressemble à : [Screenshot 2020-05-01 at 16 25 37]<https://user-images.githubusercontent.com/22340670/80812514-6b693b00-8bc8-11ea-9354-c643d7d80acb.png> [source](https://github.com/surfriderfoundationeurope/etl/tree/dev/code-review/docs/source) [build](https://github.com/surfriderfoundationeurope/etl/tree/dev/code-review/docs/build) à compléter ! Optimisations * correction/optimisation de fillGPS La fonction fillGPS me semblait compliquée et sujet à erreurs (par ex, si le GPS et la vidéo commencent ou finissent pas ensemble). Puis, j'ai réalisé que les seuls points qui nous intéressaient étaient en fait ceux où il y a un déchet détecté. Donc, au lieu d'interpoler toutes les données manquantes du fichier GPS, je n'interpole que les données dont le timestamp correspond à un déchet détecté par l'IA (cf mon point correction de trashGPS ci-après). * changement d'ordre pour FAIL le plus tôt possible (sanity checks) Par ex, c'est dommage de faire un call à l'IA si à la fin la connection à la DB échoue. ou si on n'arrive pas à extraire les données GPS du fichier. * J'ai enlevé le script shell qui faisait appelle à une commande juste pour avoir la durée du média, et j'ai remplacer par une fonction python. * J'ai remplacé l'appel par ligne de commande à goproToGPx pour utiliser le paquet Pypi de Raph. D'ailleurs @rcourivaud<https://github.com/rcourivaud> , comment je fais pour fixer un truc sur le paquet ? (je trouve pas ton repo) * J'ai implémenter un CLI pour lancer l'ETL depuis le shell. C'est peut être un peu plus pratique que le parseargs (je trouve). Nouvelles features Correction du trashGPS * On n'utilisait pas l'information 'frame_to_box' donnée par l'IA, qui donne le numero de la frame sur laquelle se trouve le trash. Etant donné que tu as aussi le fps et la durée, à partir du timestamp de début, on peut retrouver le timestamp du trash. A confirmer avec la team MOT (@charlesollion<https://github.com/charlesollion> ? ) si c'est bien ça, mais j'ai l'impression que oui. Du coup, ça permet d'optimiser la fonction qui prenait longtemps pour estimer les géométrie (X, Y, Z) ) partir de (latitude, longitude) car celle ci ne loop que sur les lignes où y a des déchets. Accepte les entrées de type Smartphone vidéos et Manuelles L'hypothèse faite ici, c'est qu'il y a 4 types de source d'acquisition possibles et que les fichiers GPX associés aux médias portent le même nom (@AntoineBruge<https://github.com/AntoineBruge>, ok?) : * gopro: fichier foo.mp4 * smartphone video: fichier foo.mov + fichier foo.gpx (@AntoineBruge<https://github.com/AntoineBruge> , quelles autres extensions ?) * smartphone photo: fichier foo.jpg + fichier foo.gpx -manuelle: fichier foo.gpx NB: La sortie de la version manuelle est légèrement différente: * colones pour les sorties gopro et smartphones : ['time', 'longitude', 'latitude', 'elevation', 'id', 'label', 'box', 'frame', 'geom'] * colones pour les sorties manuelles : [time', 'longitude', 'latitude', 'label', 'geom'] Pouvoir travailler 100% en ligne En fait, quand on veut tester ou développer, c'est pratique de ne pas être dépendant de Postgre et de Azure. Donc tu verras, j'ai essayé de documenter, mais dans la commande pour lancer l'ETL, on peut choisir de travailler avec des données locales plutôt que de télécharger depuis Azure (on pourra comme ça imaginer à l'avenir télécharger depuis d'autres sources). Pareil pour la sortie, on peut choisir de sauver le résultat en CSV localement plutôt que de l'insérer dans la base de données. Todo, next steps * Voir comment télécharger un seul fichier du blob * Voir comment noter que l'ETL a déjà tourné sur un média, si ça a SUCCESS ou FAIL, ainsi que sa version, celle de l'IA. * Quelques fix dans le paquet de Raph qui extrait les données GPX * Ajout de tests unitaires * Porter sur Azure fonction Qu'en dites vous ? ++

…

cl3m3nt · 2020-05-05T08:30:37Z

Bonjour tout le monde, merci pour les infos complémentaires Antoine et merci Raphaelle pour toutes les propositions ! On parle de tout ça tout à l'heure, on aura pas mal de choses voir ensemble j'ai l'impression :) A tout à l'heure. Clement

…

-- Clément

cl3m3nt · 2020-05-13T14:35:46Z

Dear @bertrandlalo, thanks for the hard work. Following our call, please find some feebacks in italic related to your PR in front of each section:

Changement de forme

Réorganisation du repo

Your proposal makes sense and the reorganisation could be done later on
J'ai essayé de faire du tri dans tous les codes, et ce que je propose comme orga du repo, c'est :

/data avec des échantillons de données d'entrées possibles (pour les tests)
/etl qui contient l'ETL principale et les utilitaires dans un paquet /etl/utils
docs: avec la docs (source & build)
/tests: qui contiendra les tests unitaires
/wip_devel: avec les notebooks & co. Pour l'instant azure est dedans.

PEP 8 et doc-string

Ok to apply Numpy docstring
I like the idea of having Sphinx documentation, this could be done later alongside repository reorganisation

J'ai appliqué les changements nécessaires pour répondre aux standards Python
La doc-string est de type 'numpy' et nous permet de générer de la jolie doc avec Sphinx
J'ai essayé de compléter le README avec les infos qui manquaient

Pandas

I find the idea of introducing Pandas dataframe very interesting to better fit to a data pipeline process. I want to evaluate pros/cons versus list/dico data structure but definitely worth to consider it

J'utilise des DataFrame pandas, qui nous permettent d'avoir accès à pleins d'utilitaires cool. Par exemple, les données GPS ont maintenant cette tête là :

                               latitude   longitude  elevation
  2018-01-24 19:27:58+00:00  33.126515 -117.327168    -17.228
  2018-01-24 19:27:59+00:00  33.126543 -117.327153    -18.199
  2018-01-24 19:28:12+00:00  33.126616 -117.325690    -18.440
  2018-01-24 19:28:13+00:00  33.126540 -117.327072    -19.161
  2018-01-24 19:28:14+00:00  33.126539 -117.327218    -18.472

Misc

No pb to convert print to logs as well as Came case to lower
Can you double check requirements.txt ? I had to add python-dotenv package to it to be able to successfully run the etl after building the Docker Image.

Print -> Logs
Camel case -> lower
ajout de requirements.txt et environment.yml pour faciliter l'installation
ajout de setup.py pour utiliser ce repo comme un paquet via pip install git+..., pas besoin de tout cloner)
sphinx doc à build avec make html, qui ressemble à :

[source](https://github.com/surfriderfoundationeurope/etl/tree/dev/code-review/docs/source) [build](https://github.com/surfriderfoundationeurope/etl/tree/dev/code-review/docs/build) à compléter !

Optimisations

There are two important changes here that we could merge asap: shell script removal for getMediaInfo as well as goproToGPx package from Raph

correction/optimisation de fillGPS
La fonction fillGPS me semblait compliquée et sujet à erreurs (par ex, si le GPS et la vidéo commencent ou finissent pas ensemble). Puis, j'ai réalisé que les seuls points qui nous intéressaient étaient en fait ceux où il y a un déchet détecté. Donc, au lieu d'interpoler toutes les données manquantes du fichier GPS, je n'interpole que les données dont le timestamp correspond à un déchet détecté par l'IA (cf mon point correction de trashGPS ci-après).
changement d'ordre pour FAIL le plus tôt possible (sanity checks)
Par ex, c'est dommage de faire un call à l'IA si à la fin la connection à la DB échoue. ou si on n'arrive pas à extraire les données GPS du fichier.
J'ai enlevé le script shell qui faisait appelle à une commande juste pour avoir la durée du média, et j'ai remplacer par une fonction python.
J'ai remplacé l'appel par ligne de commande à goproToGPx pour utiliser le paquet Pypi de Raph. D'ailleurs @rcourivaud , comment je fais pour fixer un truc sur le paquet ? (je trouve pas ton repo)
J'ai implémenté un CLI pour lancer l'ETL depuis le shell. C'est peut être un peu plus pratique que le parseargs (je trouve) et on le lance avec etl [OPTIONS]

Nouvelles features

Correction du `trashGPS`

On n'utilisait pas l'information 'frame_to_box' donnée par l'IA, qui donne le numero de la frame sur laquelle se trouve le trash. Etant donné que tu as aussi le fps et la durée, à partir du timestamp de début, on peut retrouver le timestamp du trash. Confirmé avec la team MOT (@charlesollion ), cf explication ici et fix là.
Du coup, ça permet d'optimiser la fonction qui prenait longtemps pour estimer les géométrie (X, Y, Z) ) partir de (latitude, longitude) car celle ci ne loop que sur les lignes où y a des déchets.

Accepte les entrées de type Smartphone vidéos et Manuelles

L'hypothèse faite ici, c'est qu'il y a 4 types de source d'acquisition possibles et que les fichiers GPX associés aux médias portent le même nom (@AntoineBruge, ok?) :

gopro: fichier foo.mp4
smartphone video: fichier foo.mov + fichier foo.gpx (@AntoineBruge , quelles autres extensions ?)
smartphone photo: fichier foo.jpg + fichier foo.gpx
-manuelle: fichier foo.gpx

NB1: La sortie de la version manuelle est légèrement différente:

colones pour les sorties gopro et smartphones : ['time', 'longitude', 'latitude', 'elevation', 'id', 'label', 'box', 'frame', 'geom']
colones pour les sorties manuelles : [time', 'longitude', 'latitude', 'label', 'geom']

NB2: Les labels des données manuelles sont différents :
{'Objet vie courante', 'Bouteille boisson', 'Peche et chasse', 'Autre dechet', 'Industriel ou construction', 'Emballage alimentaire', 'Dechet agricole', 'Autres dechets +10'}

Pour tester ça en local, vous pouvez faire (après avoir activé l'environnement, cf README.rst) :

pour les données manuelles :

etl --data-source local --media sample.gpx  --data-dir  data/osm_tracker/ --target-storage local

pour les données gopro:

etl --data-source local --media sample.mp4  --data-dir  data/gopro/ --target-storage local

pour les données smartphone vidéos:

etl --data-source local --media sample.mp4  --data-dir  data/smartphone_video/ --target-storage local

Données smartphone photo : @AntoineBruge, si t'as un exemple de GPX associé à une photo ?

Pouvoir travailler 100% en local (sans se connecter à Azure & Postgre)

En fait, quand on veut tester ou développer, c'est pratique de ne pas être dépendant de Postgre et de Azure. Donc tu verras, j'ai essayé de documenter, mais dans la commande pour lancer l'ETL, on peut choisir de travailler avec des données locales plutôt que de télécharger depuis Azure (on pourra comme ça imaginer à l'avenir télécharger depuis d'autres sources). Pareil pour la sortie, on peut choisir de sauver le résultat en CSV localement plutôt que de l'insérer dans la base de données.

Todo, next steps

Voir comment télécharger un seul fichier du blob
Voir comment noter que l'ETL a déjà tourné sur un média, si ça a SUCCESS ou FAIL, ainsi que sa version, celle de l'IA.
Quelques fix dans le paquet de @rcourivaud qui extrait les données GPX
Ajout de tests unitaires
Prévoir les migrations de la base de données
Question: Est-ce qu'on peut rediscuter ce qu'on doit insérer dans la base de données ? J'ai peur qu'il manque quelques infos.
Tester l'image docker, car je suis pas hyper sûre de moi (@rcourivaud)
Porter sur Azure fonction

Qu'en dites vous ?

++

cl3m3nt · 2020-05-13T14:46:13Z

Dear @bertrandlalo, following previous feedbacks, my recommendation to integrated smoothly first updates is for you to open a new PR with:

data: add the /data folder
media: add the media.py module (within scripts folder) with only get_media_duration function. The infer_media_source function might be of interest but we need to consider first how media are going to be stored within blob storage. Typically, media from different source might be stored within different containers.
gps: update the gps.py module with extract_gpx_from_gopro function to replace the previous one that was calling the os.subprocess
exception :add the exception.py module at the extract_gpx_from_gopro function rely on it.

This is an important step as this will allow us to remove dependancies to subprocess call as well as to gopro2gpx 3rd party. Tx

bertrandlalo · 2020-07-21T17:04:15Z

@cl3m3nt @AntoineBruge
Juste un petit message, Clément, pour te dire que ce n'est pas très cool de :

fermer une Pull-Request sans en informer l'auteur
prendre la quasi entièreté du code de la Pull-Request en question et le re-commit comme s'il était de toi
accepter ses propres Pull-Request... c'est presque absurde !

C'est dommage, j'aurais bien aimé faire une team ETL... le code, c'est tellement mieux à plusieurs !

cl3m3nt · 2020-07-22T16:40:44Z

Bonjour Raphaelle, je suis surpris du contenu de ton message, alors que je t'avais fait part de ma volonté d'intégrer des propositions progressivement. Si tu le souhaites, on peut en reparler afin d'évoquer la frustration que j'ai ressentie dans ton mail. Nous pensions justement avec Antoine te faire signe pour un nouveau besoin ponctuel. Qu'en penses tu ? Je peux trouver des disponibilités la semaine prochaine pour en parler. Clement

…

On Tue, Jul 21, 2020 at 7:04 PM Raphaëlle Bertrand-Lalo < ***@***.***> wrote: @cl3m3nt <https://github.com/cl3m3nt> @AntoineBruge <https://github.com/AntoineBruge> Juste un petit message, Clément, pour te dire que ce n'est pas très cool de : - fermer une Pull-Request sans en informer l'auteur - prendre la quasi entièreté du code de la Pull-Request en question et le *re-commit comme s'il était de toi* - accepter ses propres Pull-Request... c'est presque absurde ! C'est dommage, j'aurais bien aimé faire une team ETL... *le code, c'est tellement mieux à plusieurs !* — You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub <#6 (comment)>, or unsubscribe <https://github.com/notifications/unsubscribe-auth/ACDYPVLOVYCQ373LWULDAE3R4XDB7ANCNFSM4MXEQ45A> .

-- Clément

bertrandlalo · 2020-07-22T17:12:36Z

Hello Clément, Sur GitHub, tu peux accepter certains bouts (commit) d’une Pull-Request sans pour autant les re-commit. La différence se trouve dans la forme plus que dans le fond, c’est à dire que la contribution en question est laissée a l’auteur original. C’est gentil de vouloir me re-integrer au projet après deux mois de silence, mais j’ai l’impression que le travail d’équipe est compliqué. J’étais super motivée mais je t’avoue que j’ai été déçue/frustrée par l’accueil de mon taffe. Bonne suite dans l’ETL, j’espère quand même que tu trouveras quelqu’un pour reviewer le code, car je continue de penser que c’est risqué de vouloir être seul sur une brique, surtout dans un projet bénévole où l’équipe est censée être mouvante. Je vous laisse en discuter ensemble. Bonne soirée ! Raphaëlle Le mer. 22 juil. 2020 à 18:41, cl3m3nt <notifications@github.com> a écrit :

…

Bonjour Raphaelle, je suis surpris du contenu de ton message, alors que je t'avais fait part de ma volonté d'intégrer des propositions progressivement. Si tu le souhaites, on peut en reparler afin d'évoquer la frustration que j'ai ressentie dans ton mail. Nous pensions justement avec Antoine te faire signe pour un nouveau besoin ponctuel. Qu'en penses tu ? Je peux trouver des disponibilités la semaine prochaine pour en parler. Clement On Tue, Jul 21, 2020 at 7:04 PM Raphaëlle Bertrand-Lalo < ***@***.***> wrote: > @cl3m3nt <https://github.com/cl3m3nt> @AntoineBruge > <https://github.com/AntoineBruge> > Juste un petit message, Clément, pour te dire que ce n'est pas très cool > de : > > - fermer une Pull-Request sans en informer l'auteur > - prendre la quasi entièreté du code de la Pull-Request en question et > le *re-commit comme s'il était de toi* > - accepter ses propres Pull-Request... c'est presque absurde ! > > C'est dommage, j'aurais bien aimé faire une team ETL... *le code, c'est > tellement mieux à plusieurs !* > > — > You are receiving this because you were mentioned. > Reply to this email directly, view it on GitHub > < #6 (comment) >, > or unsubscribe > < https://github.com/notifications/unsubscribe-auth/ACDYPVLOVYCQ373LWULDAE3R4XDB7ANCNFSM4MXEQ45A > > . > -- Clément — You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub <#6 (comment)>, or unsubscribe <https://github.com/notifications/unsubscribe-auth/AFKOIPWCKP22MG5SHDDMIX3R44JBZANCNFSM4MXEQ45A> .

bertrandlalo · 2020-07-22T17:13:18Z

Le mer. 22 juil. 2020 à 19:12, Raphaelle Bertrand <r.bertrand.lalo@gmail.com> a écrit :

…

Hello Clément, Sur GitHub, tu peux accepter certains bouts (commit) d’une Pull-Request sans pour autant les re-commit. La différence se trouve dans la forme plus que dans le fond, c’est à dire que la contribution en question est laissée a l’auteur original. C’est gentil de vouloir me re-integrer au projet après deux mois de silence, mais j’ai l’impression que le travail d’équipe est compliqué. J’étais super motivée mais je t’avoue que j’ai été déçue/frustrée par l’accueil de mon taffe. Bonne suite dans l’ETL, j’espère quand même que tu trouveras quelqu’un pour reviewer le code, car je continue de penser que c’est risqué de vouloir être seul sur une brique, surtout dans un projet bénévole où l’équipe est censée être mouvante. Je vous laisse en discuter ensemble. Bonne soirée ! Raphaëlle Le mer. 22 juil. 2020 à 18:41, cl3m3nt ***@***.***> a écrit : > Bonjour Raphaelle, > > je suis surpris du contenu de ton message, alors que je t'avais fait part > de ma volonté d'intégrer des propositions progressivement. > Si tu le souhaites, on peut en reparler afin d'évoquer la frustration que > j'ai ressentie dans ton mail. > Nous pensions justement avec Antoine te faire signe pour un nouveau besoin > ponctuel. > Qu'en penses tu ? Je peux trouver des disponibilités la semaine prochaine > pour en parler. > > Clement > > On Tue, Jul 21, 2020 at 7:04 PM Raphaëlle Bertrand-Lalo < > ***@***.***> wrote: > > > @cl3m3nt <https://github.com/cl3m3nt> @AntoineBruge > > <https://github.com/AntoineBruge> > > Juste un petit message, Clément, pour te dire que ce n'est pas très cool > > de : > > > > - fermer une Pull-Request sans en informer l'auteur > > - prendre la quasi entièreté du code de la Pull-Request en question et > > le *re-commit comme s'il était de toi* > > - accepter ses propres Pull-Request... c'est presque absurde ! > > > > C'est dommage, j'aurais bien aimé faire une team ETL... *le code, c'est > > tellement mieux à plusieurs !* > > > > — > > You are receiving this because you were mentioned. > > Reply to this email directly, view it on GitHub > > < > #6 (comment) > >, > > or unsubscribe > > < > https://github.com/notifications/unsubscribe-auth/ACDYPVLOVYCQ373LWULDAE3R4XDB7ANCNFSM4MXEQ45A > > > > . > > > > > -- > Clément > > — > You are receiving this because you were mentioned. > Reply to this email directly, view it on GitHub > <#6 (comment)>, > or unsubscribe > <https://github.com/notifications/unsubscribe-auth/AFKOIPWCKP22MG5SHDDMIX3R44JBZANCNFSM4MXEQ45A> > . >

cl3m3nt · 2020-07-24T09:13:20Z

Bonjour Raphaelle, ok je comprends mieux. Si tu changes d'avis, n'hésite pas à me faire signe. Il y a deux sujets intéressants que je pensais pouvoir te proposer. Clement On Wed, Jul 22, 2020 at 7:13 PM Raphaëlle Bertrand-Lalo < notifications@github.com> wrote:

…

Le mer. 22 juil. 2020 à 19:12, Raphaelle Bertrand < ***@***.***> a écrit : > Hello Clément, > > Sur GitHub, tu peux accepter certains bouts (commit) d’une Pull-Request > sans pour autant les re-commit. La différence se trouve dans la forme plus > que dans le fond, c’est à dire que la contribution en question est laissée > a l’auteur original. > > C’est gentil de vouloir me re-integrer au projet après deux mois de > silence, mais j’ai l’impression que le travail d’équipe est compliqué. > J’étais super motivée mais je t’avoue que j’ai été déçue/frustrée par > l’accueil de mon taffe. > > Bonne suite dans l’ETL, j’espère quand même que tu trouveras quelqu’un > pour reviewer le code, car je continue de penser que c’est risqué de > vouloir être seul sur une brique, surtout dans un projet bénévole où > l’équipe est censée être mouvante. Je vous laisse en discuter ensemble. > > Bonne soirée ! > > Raphaëlle > > > Le mer. 22 juil. 2020 à 18:41, cl3m3nt ***@***.***> a > écrit : > >> Bonjour Raphaelle, >> >> je suis surpris du contenu de ton message, alors que je t'avais fait part >> de ma volonté d'intégrer des propositions progressivement. >> Si tu le souhaites, on peut en reparler afin d'évoquer la frustration que >> j'ai ressentie dans ton mail. >> Nous pensions justement avec Antoine te faire signe pour un nouveau besoin >> ponctuel. >> Qu'en penses tu ? Je peux trouver des disponibilités la semaine prochaine >> pour en parler. >> >> Clement >> >> On Tue, Jul 21, 2020 at 7:04 PM Raphaëlle Bertrand-Lalo < >> ***@***.***> wrote: >> >> > @cl3m3nt <https://github.com/cl3m3nt> @AntoineBruge >> > <https://github.com/AntoineBruge> >> > Juste un petit message, Clément, pour te dire que ce n'est pas très cool >> > de : >> > >> > - fermer une Pull-Request sans en informer l'auteur >> > - prendre la quasi entièreté du code de la Pull-Request en question et >> > le *re-commit comme s'il était de toi* >> > - accepter ses propres Pull-Request... c'est presque absurde ! >> > >> > C'est dommage, j'aurais bien aimé faire une team ETL... *le code, c'est >> > tellement mieux à plusieurs !* >> > >> > — >> > You are receiving this because you were mentioned. >> > Reply to this email directly, view it on GitHub >> > < >> #6 (comment) >> >, >> > or unsubscribe >> > < >> https://github.com/notifications/unsubscribe-auth/ACDYPVLOVYCQ373LWULDAE3R4XDB7ANCNFSM4MXEQ45A >> > >> > . >> > >> >> >> -- >> Clément >> >> — >> You are receiving this because you were mentioned. >> Reply to this email directly, view it on GitHub >> < #6 (comment) >, >> or unsubscribe >> < https://github.com/notifications/unsubscribe-auth/AFKOIPWCKP22MG5SHDDMIX3R44JBZANCNFSM4MXEQ45A > >> . >> > — You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub <#6 (comment)>, or unsubscribe <https://github.com/notifications/unsubscribe-auth/ACDYPVPULEN75QUED4NXU43R44M37ANCNFSM4MXEQ45A> .

-- Clément

bertrandlalo added 30 commits April 29, 2020 21:39

Code review, work in progress

0900e32

Move functions in utils package

2b43f06

Major style refactoring

e2e29eb

Add generic exception specific to ETL

b4d8e8f

Add .env to gitignore

13407d2

Remove MediaInfo

8a0218f

Move requirements.txt and environment.yml to root

43a8d1d

Handle file from smartphone, where GPX are given separately

7e01551

Change path of gpx output

5c3f366

Rename modules

6506dcf

Assert conn is not None

0850b78

Add CLI to launch th ETL flow

224492c

Re-organize repo and add version

fc79c0e

Move samples in dedicated directory

8e808c9

Add media helpers

c13b03a

Black PEP.8 autom code format

8ebc84e

Handle trash time interpolation and compute geom afterwards

51841f7

simple quotes (black)

05a53b4

Add example of trashes answer from AI

54c37b9

Reorganize samples

c8c6eb3

Add sphinx doc

26f06c4

Fix docstring

99292ab

Readme typo

6d3c334

Reorganization : move wip codes in directory 'devel'

c95eea5

Reorganization : move wip codes in directory 'wip_devel'

94d0185

Move get_media_duration to media

6953727

Example .env file

3b6d962

Allow saving in local storage (for devel purpose)

a29fbc3

Build Sphinx documentation

c30bb22

remove DS_Store

d073508

bertrandlalo self-assigned this May 1, 2020

bertrandlalo linked an issue May 1, 2020 that may be closed by this pull request

Code review #5

Closed

bertrandlalo added 15 commits May 1, 2020 17:34

Add example

ac79fe5

Fix typo

1588851

Fix typo

6417e5c

Add etl

5cf6775

Fix typo

0ba34be

Fix typo

56e9092

Fix typo

159be3e

Fix issue 7: handle multiple frames for one trash

62c1c75

Rebuild doc

c9203b4

Add docker instructions

1876a9f

Clean and test installation guidelines

d9977a6

Add setup.py

ebf1f9b

Update docs

0abe1ea

Change python version requirement

6dcfb09

Update readme with docker instructions

ce7636c

bertrandlalo linked an issue May 3, 2020 that may be closed by this pull request

Attaching the timestamp to each trash, and not to each box #7

Closed

bertrandlalo requested a review from AntoineBruge May 3, 2020 07:18

cl3m3nt closed this May 13, 2020

cl3m3nt deleted the dev/code-review branch April 14, 2022 13:37

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Dev/code review #6

Dev/code review #6

bertrandlalo commented May 1, 2020 •

edited

Loading

AntoineBruge commented May 4, 2020 via email

cl3m3nt commented May 5, 2020 via email

cl3m3nt commented May 13, 2020 •

edited

Loading

cl3m3nt commented May 13, 2020 •

edited

Loading

bertrandlalo commented Jul 21, 2020

cl3m3nt commented Jul 22, 2020 via email

bertrandlalo commented Jul 22, 2020 via email

bertrandlalo commented Jul 22, 2020 via email

cl3m3nt commented Jul 24, 2020 via email

Dev/code review #6

Dev/code review #6

Conversation

bertrandlalo commented May 1, 2020 • edited Loading

Changement de forme

Réorganisation du repo

PEP 8 et doc-string

Pandas

Misc

Optimisations

Nouvelles features

Correction du trashGPS

Accepte les entrées de type Smartphone vidéos et Manuelles

Pouvoir travailler 100% en local (sans se connecter à Azure & Postgre)

Todo, next steps

AntoineBruge commented May 4, 2020 via email

cl3m3nt commented May 5, 2020 via email

cl3m3nt commented May 13, 2020 • edited Loading

Changement de forme

Réorganisation du repo

PEP 8 et doc-string

Pandas

Misc

Optimisations

Nouvelles features

Correction du trashGPS

Accepte les entrées de type Smartphone vidéos et Manuelles

Pouvoir travailler 100% en local (sans se connecter à Azure & Postgre)

Todo, next steps

cl3m3nt commented May 13, 2020 • edited Loading

bertrandlalo commented Jul 21, 2020

cl3m3nt commented Jul 22, 2020 via email

bertrandlalo commented Jul 22, 2020 via email

bertrandlalo commented Jul 22, 2020 via email

cl3m3nt commented Jul 24, 2020 via email

bertrandlalo commented May 1, 2020 •

edited

Loading

Correction du `trashGPS`

cl3m3nt commented May 13, 2020 •

edited

Loading

Correction du `trashGPS`

cl3m3nt commented May 13, 2020 •

edited

Loading