问题 数仓项目中有上游将SQL Server升级为Always On高可用集群,导致我们使用OLEDB连接方式的SSIS Package在运行时出现...
需求:将当前目录下所有文本文件合并成一个新文件。 CMD实现 copy *.txt cmd_new.txt 以上写法有个小小不足之处,若有文件最后一行无换行符,合并后会出现后一个文件的...
关于Quick Sort的介绍网上资料非常多,本文仅是我重新学习此算法时的笔记,如有纰漏,还请网友指出。 快排算法利用分治法(divide and co...
概述 实现之前文章中用SQL实现的功能: 得益于python简洁的表达式,以及pandas库的强大功能,实现起来非常轻松,关键代码仅三行: 代码 读...
概述 用Python实现之前文章中用SQL实现的转换,交叉表转为长宽表。 数据准备 import pandas as pd df = pd.read_csv(r'D:\CategoryConfig.csv') df Category Level A B C D 0 Online 1 234 345 644 987 1 Online 2 213 456 543 657 2 Online 3...
为何要用SQLCMD 平时习惯了在SSMS中做开发,有什么变动也直接在SSMS的查询界面中执行,更新的对象和步骤少还好,如果一下子需要执行非常...
需求 以上数据样例,需要转为: 实际业务数据可能不止以上两列,而且数据量比较大,实现时要考虑性能。 本文用SQL实现。 思路 看上去是简单的字符串拆分...
场景 公司电脑无管理员权限,无法自行安装软件,经申请安装上了everything(通过域管理自动安装),但启动时提示需要管理员权限,让输入账号...
本文主要用递归算法解决大家非常熟悉的排列组合问题。 组合 方法一 需求:求从含m个数据中取出n个数据的所有取法。 解析:设列表为a[m],从m个数取...
问题:求集合所有子集。 下面分别给出两种思路的递归和非递归解法,用python实现。 方法一 a的子集可以分为两部分: 不含a[0]的所有子集 含a[...
知识准备 可变类型(mutable):list、set、dict可变类型,支持原地址直接改变元素(item)的值 不可变类型(immutable...
概述 数仓中经常会有一张日历维表,里面预存了很多日期截取和计算相关的字段,便于与事实表关联之后进行各类基于日期相关的分析。 现假定已有日历维表字...
上一篇介绍了如何用纯SQL生成测试数据,但SQL功能有限,本篇介绍python faker库的使用。 需求 生成5000条记录,字段如下: fake...
需求 项目中偶尔会有造数据进行测试的情况,根据常见的数据特征,我这里假设数据某表Table_X含4个字段,每个字段的要求如下,需要造出5000...
在进入并发编程的世界之前,先看一个对比的例子: 举例 串行执行 import time def count(task_name): print(task_name,time.strftime("%X"),"One") time.sleep(1) # 模拟一个需要堵塞一秒的任务 print(task_name,time.strftime("%X"),"Two") def main(): count('Task-A') count('Task-B') count('Task-C') if __name__ == "__main__": s = time.time() main() elapsed = time.time() - s print(f"Total Run...