4006-998-758
3000+课程任你选择
Snowflake高级培训
研发学院 Snowflake高级培训 开课时间:2022-12-29
丁来强

世界跨国大数据公司EMC美国研发中心(2006-2011):历任软件开发工程师、高级软件开发工程师,高级架构师,大数据技术经理。

世界顶级大数据公司Splunk(2012-2015),历任美国Splunk上海研发中心高级架构师、高级研发经理。

国内Top云平台研发中心(2016—至今):大数据技术总监。

丁老师在以上3家公司工作10余年,主要从事云计算和大数据研发等工作,长期任职大数据平台的构建相关领域的产品研发工作,在大数据处理、大数据分布式并行计算,流式计算处理系统、数据可视化领域有丰富的实战项目经验。


查看老师详情
课程内容

课程大纲

第一天:

1. Snowflake介绍

实时数仓

架构组件

关键功能介绍

数据声明周期

生态

2. 命令行

执行命令

使用变量

批量执行

调整输出格式

常见命令

3. 加载数据

数据源位置

数据格式

数据文件限制与最佳实践

路径组织

加载配置

批加载

历史数据记载

元数据加载

JSON数据加载实践

CSV数据加载实践

4. Snowpipe持续加载

架构与原理

构建持续加载任务

Snowpipe一般考虑与实践

云存储持续加载实践

管理Snowpipe

错误排查与通知

5. 数据查询与操作

数据查询语法

JOIN

子查询

查询历史数据

查询半结构数据

使用窗口函数

典型案例

6. 元数据查询与操作

列类型

集群key

列长度

半结构化与平坦结构

观测存储

复制表格、Schema、数据库

表格类型与转换

元数据查询

元数据查询限制

典型案例

7. 数据加载时转换

基本介绍

支持限制

CSV转换操作

典型案例

JSON转换

典型案例

 

第二天:

8. 开发应用概述

UDF

Snowpark

外部函数

存储过程

脚本

9. UDF

标量函数

表格化函数

Python UDF介绍

设计构建UDF

调用UDF

使用三方库

构建UDTF

排错

10. Snowpark基础

环境构建

构建DF

JOIN DF

列操作

行操作

函数调用

评估DF

保存DF

构建视图

操作文件

执行SQL

11. Snowpark高级

构建SQL UDF

构建SQL UDTF

构建存储过程

调用函数与存储过程

异常与排错

12. 外部函数

外部函数介绍

输入输出规范

格式处理

性能考虑

最佳实践

AWS服务外部函数策略

安全考虑

13. 存储过程

构建存储过程

DDL与命名规范

事务管理

调用

构建最佳实践

14. 脚本

基本介绍

脚本块

变量

返回值

分支

游标

结果集

异常处理

15. 开发安全防护

数据库对象鉴权

对象鉴权修改

UDF安全防护

理解存储过程的鉴权

存储过程鉴权的最佳实践

角色管理

使用Future Grants

16. 数据治理与安全实践

对象依赖

分类

访问历史

用户与角色

对象安全

数据安全

访问控制

认证介绍

网络策略

返回上一级