Bulletin #8, 2016-07-26: Data Science, Excel & more! La science des données, Excel et +!

Data Science & Excel! La science des données & Excel! | Quotable links • Liens citables
No. 8, 2016-07-26                                      wrangler/responsable: @prooffreader



Welcome to the eighth edition (July 26, 2016) of the MTLDATA Bulletin. Don’t forget, you can also find us on the Web, Facebook, Twitter, LinkedIn and Meetup. This issue: Excel, links, calendar, jobs and more! English content is in blue, French in green. The ninth issue should be released mid-August, and will feature an interview with local startup reelyActive.


Bienvenue à la huitième édition (26 juillet 2016) du Bulletin MTLDATA; n’oubliez pas, vous pouvez nous trouver aussi sur le Web, Facebook, Twitter, LinkedIn et Meetup. Cette édition: Excel, des jobs et plus! Le contenu en anglais est en bleu, le français en vert. La huitème édition devra être diffusée mi-août, et vous y retrouverez une entrevue avec le startup montréalais reelyActive.


Bulletin also published online http://mtldata.blogspot.ca ← site Web du Bulletin






PHOTO MTLDATA • MTLDATA PHOTO


Cm7gsp0UsAAebS3.jpg-large


Le 9 juillet, MTLDATA et DecodeMTL ont organisé un tutoriel D3.js, mettant en vedette le renommé Christophe Viau. C’était informatif!


On July 9, MTLDATA and DecodeMTL hosted a D3.js tutorial by the renowned Christophe Viau. An informative time was had by all.






LA SCIENCE DES DONNÉES ET… EXCEL?! •
DATA SCIENCE AND … EXCEL?!


It has been my experience that many late-blooming data scientists (myself, @prooffreader, included) go through a phase of rejecting Excel, which I suppose is only natural given human psychology. Excel is a bloated Microsoft product, and as we program we come to appreciate lean efficiency. Excel is limited conceptually to rows and columns, while relational and NoSQL databases aren’t. Excel is not exactly big data-friendly, and don’t get me started on VBA. Plus, it’s the tool we first learned, and we thought it was the bee’s knees, and that becomes a little embarrassing as we learn what’s possible in a true programmatic environment.


But Excel has a few advantages that come in really handy: its filters and pivot tables (which exist in other formats but aren’t quite as handy), its conditional formatting and, by far the most important, its ubiquity. Whenever we have to share our work with non-data scientists, I’m comfortable wagering that the vast majority of the time Excel will be involved at some point.


So, my suggestion is to embrace Microsoft Excel, warts and all. Even a master woodworker sometimes needs a hammer. If it becomes really entwined in your work, there are great packages like RExcel and Python’s xlwings to leverage instead of VBA, as well. I apologize for the following pun: Excel can help make your work Excel-lent!


Je trouve que bien des gens qui arrivent tard à une carrière de scientifique de données (moi, @prooffreader, inclus) subissent une phase où ils rejettent Excel, ce qui est naturel étant donné la psychologie humaine. Excel, c’est un produit Microsoft surchargé, et en apprenant la programmation nous apprendrons à en apprécier l'efficacité. Excel est limitée sur le plan conceptuel des lignes et des colonnes, tandis que les bases de données relationnelles et NoSQL ne le sont pas. Excel n’est pas exactement l’outil approprié pour «big data», et je n’ose pas faire des commentaires concernant le VBA. En plus, Excel, c’est possiblement le premier outil que nous avons appris, et nous pensions que c’était merveilleux — ensuite, celà devient plutôt gênant quand nous découvrons toutes les possibilités existantes dans un véritable environnement programmatique.

Mais Excel a quelques avantages vraiment pratique: ses filtres et tableaux croisés dynamiques (qui existent dans d'autres formats, mais qui ne sont pas aussi pratique), son formatage conditionnel et, le plus important, sa présence un peu partout. Chaque fois que nous devons partager notre travail avec des gens qui ne sont pas des scientifiques de données, je gage que c’est extrêmement probable que Excel deviendra impliqué à un moment donné.

Donc, ma suggestion est d'accepter Microsoft Excel, malgré ses défauts. Même un maître menuisier a parfois besoin d'un marteau. Si Excel devient vraiment un problème avec votre travail, il y a des modules génials comme RExcel et, en Python, xlwings pour prendre la place du VBA. Je m‘excuse pour le jeu de mots suivant: Excel peut aider à rendre votre travail Excel-lent!






LIENS CITABLES • QUOTABLE LINKS








CALENDRIER COMMUNAUTAIRE • COMMUNITY CALENDAR




Upcoming MTLDATA events without firm dates:
Évènements MTLDATA qui s’en viennent, mais on est pas trôp sur exactement quand:
  • "Building vs. Buying," a.k.a. "To build or not to build, that is the question" panel discussion (late Sept.)
  • Video Games, VR and Data, Oh My.
  • D3 workshop, remastered and extended edition, with Christophe Viau






EMPLOIS • JOBS








PENSÉE FINALE • FINAL THOUGHT


If you’re an Linuxer or a Mac Addict, type telnet towel.blinkenlights.nl into your terminal and see what happens. If you’re stuck on Windows, you can always search for telnet towel.blinkenlights.nl in YouTube, but it’s just not the same.


You will not be disappoint, especially if you know where the quote “Why I should stick my neck out for you is far beyond my capacity” comes from.


Image_1469447529.png

Si vous êtes utilisateur de Linux ou Mac, tapez telnet towel.blinkenlights.nl dans le terminal et regardez ce qui arrive. Si vous êtes poigné avec Windows, vous pouvez toujours rechercher telnet towel.blingenlights.nl à YouTube, mais l’effet n’est pas exactement le même.

Vous ne serez pas déçu, surtout si vous reconnaissez la citation, “Et bien, s'il y a un point central dans cet univers, tu es sur la planète qui en est le plus éloignée.”
Labels: , , , ,
edit

No comments:

Post a Comment