0")`,最后生成个log.txt,哪步删了啥、为什么删,清清楚楚。上次交接代码,同事扫一眼log就明白我为啥砍掉那20%异常订单。 避坑部分全是血泪。`df.append`搜教程还在用,结果运行报错说弃用了,换成`pd" />

`tqdm`是个小东西,但真救命。`for idx, row in tqdm(df.iterrows, total=len(df)):`,进度条一出来,心里就有底。还有`pandas-log`,加一行`df = df.log_dropna.log_query("price > 0")`,最后生成个log.txt,哪步删了啥、为什么删,清清楚楚。上次交接代码,同事扫一眼log就明白我为啥砍掉那20%异常订单。

避坑部分全是血泪。`df.append`搜教程还在用,结果运行报错说弃用了,换成`pd.concat([df_old, df_new], ignore_index=True)`立马好了。Jupyter里画图老多个`

大纲里说“不要堆砌工具”,我试了。现在写脚本,先想这步是不是非得在Python里做。比如去重,数据库`DISTINCT`更快,就写SQL;比如算移动平均,`df['ma7'] = df['sales'].rolling(7).mean`就行,绝不手写for循环。
工具不是越多越好,是哪个最省事、最不容易出错、下次还能看懂。

我照着这个路子,从读一个Excel,到现在能定时跑脚本,自动生成周报PDF发邮箱。中间重装过三次Python环境,删过七八个没用的包,现在电脑里就留着numpy、pandas、matplotlib、seaborn、sqlalchemy、tqdm,够用了。
昨天导出的报表,同事说比去年外包公司做的还清楚。

就这。
配资网提示:文章来自网络,不代表本站观点。