我做了很多数据分析,我在大学期间做过大量的数据处理,我的本科论文本质上是一个数据处理项目。对于所有这些,我最终使用Python来处理一些最复杂的部分,我发现通过结合使用Excel和Python,我能够真正提高我的数据处理能力,并轻松享受Excel的相对简单性,同时仍能从Python的高级功能中受益。
如果你想使用现在Excel中内置的Python版本,这非常容易。它使用了Anaconda提供的一些Python库。至于用例,你可以运行Python脚本、执行数据分析、创建图表、浏览电子表格见解、使用图表可视化数据等。
除了自带的核心库之外,你还可以通过Anaconda灵活地导入更多库。你需要在Python Excel单元格中使用 Python import语句来完成导入过程。微软推荐Astropy、Faker、IPython、NumPy、Pandas、Prince、qrcode 和许多其他库。你可以前往该公司的官方网站浏览整个列表。我最常使用Pandas和NumPy,但网上有无数教程可以帮助你入门。
不过说实话,我只是将工作表和Python工作分开。我会在Google工作表或Excel中工作,完成后,我会导出文件并开始用Python工作。我不会同时做这两件事,但我可以在完成其他流程后重新导入数据,以便在Excel中进一步调整。
1、自动化和效率,忘记复杂的公式,只需使用脚本即可。
Excel非常棒,可以快速轻松地控制电子表格。它拥有强大的公式和大量功能,非常棒。但是,如果你花时间学习Python,你可以自动化许多流程,甚至不需要查看任何复杂的东西。对于数据清理、合并电子表格和构建复杂数据转储等操作,Python非常棒。
例如,过去,我必须使用两个工作表之间的公共键合并电子表格,然后从电子表格B中获取数据并将其附加到电子表格 A 中的每个相关行。这在Excel中是可能的,但使用Python,我有脚本可以自动完成此过程。我只需在与电子表格相同的文件夹中运行我的脚本,它就会为我完成所有工作,生成一个包含我需要的所有内容的完整CSV。
当然,你也可以用Python中的Pandas库读取XLSX文件,所以微软自己的电子表格格式还是完全受支持的。
2、高级数据可视化,Matplotlib和Plotly都很棒,比Excel好得多。
如果你想完全控制数据可视化方式,那么Python是必须的。世界各地的数据科学家都在使用Python,这是有原因的。它能够生成精美的图表或以引人注目的方式可视化数据,这要归功于matplotlib等库。我所做的几乎所有数据可视化都是通过matplotlib进行的,它让你可以完全控制图表的每个方面。
与Python的其他部分一样,这绝对是一个学习曲线,但如果你想以最佳方式可视化数据,我强烈建议你掌握它。Matplotlib是一个用于可视化的低级库,但你也可以尝试使用Plotly之类的库,这是一个更高级、更现代的库,可能更容易上手。Plotly有一个可用于绘图的高级API,如果你是编程新手,这会让事情变得容易得多。
3、无缝集成,微软在Excel中集成Python非常棒。
由于Python已集成到Excel中,因此将两者结合使用从未如此简单。您只需选择顶部的公式,然后选择插入 Python即可。你还可以键入=PY在给定单元格中调用Python。Excel中的Python依赖于自定义Python函数 x1 () 来连接Excel和Python,该函数可很好地处理范围、表格、查询和名称等基本对象。
除此之外,你还可以使用Excel进行数据输入,同时受益于Python的强大功能,并且只需一个应用程序即可完成所有操作。它是一种非常强大的编程语言,我强烈建议你掌握它,因为它可以让您的数据分析变得更容易。