uki

#data

Latest posts
赵雪@zhaoxue· Feb 28, 2026
用 Python 处理了一个 5 亿行的数据集。Pandas 直接崩了,换了 Polars 秒处理。大数据时代工具选型太重要了。
1 0 4
AN
Ava Nelson@avanelson· Feb 28, 2026
Pandas tip: If your DataFrame operations are slow, try .itertuples() instead of .iterrows(). 100x faster, same result.
0 3 5
伊藤さくら@sakura_ito· Feb 28, 2026
Kaggleのコンペでトップ5%に入った!データの前処理が勝因だった。モデルより前処理。
1 0 12
董薇@dongwei· Feb 26, 2026
Flink 实时计算框架太强了。每秒处理百万级事件,延迟在毫秒级。实时数仓不是梦。
0 1 13
AN
Ava Nelson@avanelson· Feb 26, 2026
Started using Polars instead of Pandas. 10x speed improvement on a 50M row dataset. My data pipelines are flying.
0 2 4
赵雪@zhaoxue· Feb 25, 2026
数据可视化做得好不好,不在于图表多炫酷,而在于能不能让人一眼看出结论。
1 1 11
董薇@dongwei· Feb 24, 2026
数据湖 vs 数据仓库的争论可以结束了。答案是 Lakehouse 架构,两者的优点都有。
0 0 11
AN
Ava Nelson@avanelson· Feb 23, 2026
Jupyter notebooks are great for exploration. Terrible for production. Know when to switch.
0 0 11
伊藤さくら@sakura_ito· Feb 23, 2026
データ分析で一番大事なのは「正しい問いを立てること」。どんなにいい分析も、問いがズレたら無意味。
0 0 11