萧祖籍寺。
量子比特报告|微信官方账号QbitAI
加载一个Jupyter插件后,不用写代码就可以做数据分析,还能帮你生成相应的代码?
没错,只要加载这个叫米托的小工具包,用Python做数据分析,就变得和Excel一样简单了:
运行速度比Excel快,不用到处搜索各种Python教程。
好用如Excel,更快更全面
米托是Jupyter笔记本的一个可编辑的电子表格插件。剪辑的时候。csv表格(具有格式转换功能),它可以生成相关的Python代码。
Mito,线粒体Mitochondria的缩写
具体来说,米托的出现似乎将Python的强大功能和Excel的易用性结合在了一起。
你只需要掌握Excel的用法,就可以使用Python的数据分析功能,就可以把写好的代码“打包”走。
它弥补了Excel在数据分析方面的几个缺陷:
Excel做不了大数据分析(大数据集处理不好)。Excel运行缓慢。Excel无法轻松创建可重复的流程。同时比SQL和Python更简单直观。毕竟这些专业工具要让0基础的初学者完全使用,至少还需要几年的时间。
根据米托测试版用户的说法,这个插件将他们用Python进行数据分析的效率提高了10倍,因为用户可以直接在米托编写Excel公式,比如=SUM(A1,100)。
那么,米托是如何将Excel逻辑转换成Python代码的呢?
作者写了一个叫Transpiler的程序,有点类似于编译器的功能。它使用抽象语法树(AST)来解析Excel源代码,并将其转换为Python源代码。
相比使用Alteryx等专业软件(费用5000美元/月)进行数据分析,米托生成的Python代码可以根据需要自行修改,灵活一点。
目前,米托使用亚马逊云平台(AWS)保存用户的相关数据,每个用户都有独立的账户。
当然,用户也可以选择将数据保存在本地。
自动生成Python代码
以美国各州“家庭平均收入”和“允许检查的火车站数量”两个数据之间的关系分析为例。
先上传“家庭平均收入”和“允许查的火车站数”的数据。
数据处理的格式是。csv。当然也可以输入Excel文件,转换成两个。米托的csv文件。
然后,要将这两个数据集合并在一起,只需用鼠标勾选相应的函数,选择相关的数据列即可。
啪!代码已生成。
然后,做透视表。分组后,使用aggregate函数切换聚合方法。
还包括数据过滤功能,也可以即时生成相关代码。
包含升序和降序排序功能,快捷简洁。
然后统计分析相关数据,过程直观。
保存分析文件的方法也很简单。文件是用Python而不是VBA写的,很难理解。
重复以上步骤也非常容易。米托自带“重复已保存的分析步骤”功能,你可以用同样的方法一键分析其他数据。
确实比一行一行写代码简单多了。
关于Mito
那么,米托的作者们,你们为什么要从事这个软件呢?
因为他们发现所谓的“几天就能入门Python数据分析”其实没那么容易.
想用Python做数据分析的初学者,不得不不断地查各种文档,求助于StackOverflow。
要真正快速地分析Python中的数据,你最终必须编写自己的软件。
三位作者,亚伦戴蒙德-雷维奇、杰克戴蒙德-雷维奇和内特拉什,都来自宾夕法尼亚大学。在校期间,他们学习了与计算机科学、统计学和商业分析相关的课程。
正是在数据分析过程中,他们萌生了制作米托的想法。
作者说软件目前不开源,因为他们还在思考如何支持这个项目的维护,转向开源的道路。
不过现在可以用了。
感兴趣的朋友,可以试试~
项目主页:
https://trymito.io/launch
—结束—
量子qbitai头条号签约
关注我们,第一时间获悉前沿科技动态。