Python 基础语法、数据结构与核心编程指南 | 极客日志

PythonAI

Python 基础语法、数据结构与核心编程指南

Python 基础教程涵盖语法、变量、数据类型、运算符、字符串处理、控制流（if/while/for）、函数定义与参数、数据容器（列表/元组/字典/集合）、文件操作、异常处理、模块与包、面向对象编程（类/对象/继承/多态）、闭包与装饰器、多线程、网络编程、正则表达式、递归、数据库连接（pymysql）、大数据处理（PySpark）及数据可视化（pyecharts）。内容包含代码示例与实战案例。

全栈工匠发布于 2025/2/7更新于 2026/7/2043 浏览

Python 基础语法

PyCharm 常用快捷键

ctrl+alt+s: 打开软件设置
ctrl+d: 复制当前行代码
shift+alt+上/下：将当前行代码向上或向下移动
ctrl+shift+f10: 运行当前代码文件
shift+f6: 重命名文件
ctrl+f：搜索

Python 基础语法

一、注释

单行注释：# 多行注释："""我是多行注释"""

二、变量与 print 输出函数

变量的定义格式：变量名=变量值如：

num=100

print() 是输出函数如：

print("helloWorld")

print() 如何输出多份内容格式

print(内容 1，内容 2...，内容 n)

三、数据类型

常见的数据类型

type() 函数用来查看数据类型如:

name="张三"
print(type(name))

四、数据类型转换

字符串，整数，浮点型数据类型转换语句分别 int(x),float(x),str(x), note:1，任何数据类型都可以转换成字符串 2，字符串转换为数字有限制 3，浮点型转换为整数需注意丢失精度问题

五、标识符

标识符命名规则： 1.由字母数字下划线组成 2.第一个字符必须是字母或者是下划线 3.标识符不能以数字开头 4.标识符区分大小写 5.不能与关键字重名常见关键字

六、运算符

常见数学运算符赋值运算符：= 常见复合赋值运算符

七、字符串

字符串定义方法三种

1.单引号方式 2.双引号方式 3.三引号方式引号的嵌套使用转义字符\ 如

print("\"helloworld\"")
print('\"helloworld\"')
print('\'helloworld\'')

字符串的拼接：

字符串的拼接使用 + 链接字符串变量或者字符串字面量如

name="张三"
print("我是"+name+",毕业于家里蹲大学")

注意无法和非字符串类型进行拼接字符串的格式化 1 语法为：'%占位符' %变量如

name="张三"
print("我是%s"% name)

name="张三"
age=10
print(f"我是{name},今年{age}岁")

# %5.2f 表示数据宽度设置为 5 位，小数精度设置为 2 位
# %.2f 表示不设置宽度，只设置小数的精度

print("1*1=%d" % (1*1))
print(f"1*1 的结果是{1*1}")

var1=input("请输入一个字符串")
var2=input("请输入一个整数")
var3=input("请输入一个浮点类型")
var4=input("请输入一个布尔类型")
print(f"输入的字符串，变量类型是{type(var1)},内容是{var1}")
print(f"输入的整数，变量类型是{type(var2)},内容是{var2}")
print(f"输入的是浮点数，变量类型是{type(var3)},内容是{var3}")
print(f"输入的是布尔类型，变量类型是{type(var4)},内容是{var4}")

if 条件：
    # 满足条件时要做的事
else:
    # 不满足条件时要做的事

age=int(input("请输入你的年龄"))
if age>18:
    print("您已成年，需支付 10 元票价")
else:
    print("您未成年，可以免费游玩")

if 条件 1：
    # 满足条件 1 要做的事
elif 条件 2：
    # 满足条件 2 要做的事
else:
    # 不满足所有条件要做的事

height=int(input("请输入您的身高（cm）"))
vip_level=int(input("请输入您的 vip 等级（1-5）"))
if height<120:
    print("您的身高低于 120cm，可以免费游玩")
elif vip_level>3:
    print("您的 vip 级别大于 3,可以免费游玩")
else:
    print("您所有优惠条件都不满足，需支付门票")

if 条件 1:
    # 满足条件 1 做的事
    if 条件 2：
        # 满足条件 2 做的事

if int(input("请输入您的身高："))>120:
    print("您的身高大于 120，不可以免费")
    print("不过若您的 vip 等级高于 3，可以免费游玩")
    if int(input("请输入您的 vip 等级："))>3:
        print("恭喜您，您的 vip 级别大于 3，可以免费游玩")
    else:
        print("您不满足所有的优惠条件，需支付门票")
else:
    print("小朋友，您可以免费游玩")

age_0=22
age_1=18
if age_0 >= 21 and age_1>=21:
    print("满足情况 1")
elif age_0<21 and age_1<21:
    print("满足情况 2")
elif age_0>=21 and age_1<21:
    print("满足情况 3")
else:
    print("满足情况 4")

age_0=22
age_1=18
if age_0 >= 21 or age_1>=21:
    print("满足情况 1")
elif age_0<21 or age_1<21:
    print("满足情况 2")
elif age_0>=21 or age_1<21:
    print("满足情况 3")
else:
    print("满足情况 4")

while 条件:
    # 条件满足时，要做的事情 1
    # 条件满足时，要做的事情 2
    ...

#向小美表白 100 次
i=0
while i<100:
    print("小美，我喜欢你")
    i+=1

"""
	设置一个范围 1-100 的随机整数变量，通过 while 循环，配合 input 语句，判断输入的数字是否等于随机数
	无限次机会，直到猜中为止
	每一次猜不中，会提示大了或小了
	猜完数字后，提示猜了几次
"""
import random
num = random.randint(1, 100)
count=0
while True:
    var=int(input("输入您想猜的数字"))
    if var<num:
        print("猜小了，请重新猜测")
    elif var>num:
        print("猜大了，请重新猜测")
    else:
        print("恭喜你猜对了")
        #break 语句用来终止 while 循环语句
        break

while 条件 1:
    # 条件 1 满足时，做的事情 1
    # 条件 1 满足时，做的事情 2
    ...
    while 条件 2:
        # 条件 2 满足时，做的事情 1
        # 条件 2 满足时，做的事情 2
        ...

#向小美表白 100 次
i=1
while i<=100:
    print(f"今天是第{i}天，准备表白...")
    j=1
    while j<=10:
        print(f"送给小美第{j}支玫瑰花")
        j+=1
    print("小美，我喜欢你")
    i+=1
print(f"坚持到第{i-1}天，表白成功")

for 临时变量 in 待处理数据集:
    # 循环满足条件时执行的代码

#遍历字符串
name="zhangsan"
for x in name:
    print(x)

range(num)

range(num1,num2)

range(num1,num2,step)

#for 循环处理字符串
for i in range(5):
    print(i)

for 临时变量 in 待处理数据集（序列）:
    # 循环满足条件时应做的事情 1
    # 循环满足条件时应做的事情 2
    for 临时变量 in 待处理数据集：
        # 循环满足条件时应做的事情 1
        # 循环满足条件时应做的事情 2

#向小美表白 for 循环嵌套改进
i=1
for i in range(1,101):
    print(f"今天向小美表白的第{i}天，坚持。")
    for j in range(1,11):
        print(f"送给小美的第{j}朵玫瑰花")
    print(f"小美，我喜欢你（第{i}天的表白结束）")
print(f"第{i}天，表白成功")

#定义两数相加函数
def add(x,y):
    result=x+y
    print(f"{x}+{y}的结果是：{result}")
    
#调用函数
add(5,6)

def 函数名 (参数...):
    函数体
    return 返回值
变量=函数 (参数)

def func(x,y):
    """
    :param x: 说明参数 x 的作用
    :param y: 说明参数 y 的作用
    :return: 返回值的说明
    """

def func_a():
    print("函数 a")
def func_b():
    print("调用函数 a")
    print("函数 b")
    
func_b()

#定义全局变量
num=100
def testA():
    print(num)
    
def testB():
    print(num)
testA()
testB()
print(f"全局变量{num}")

#定义全局变量
num=100
def testA():
    print(num)
    
def testB():
    global num
    num=200
    print(num)
testA()  #100
testB()  #200
print(f"全局变量{num}")  #200

#字面量
[元素 1，元素 2，元素 3，元素 4，...]
#定义变量
变量名称=[元素 1，元素 2，元素 3，元素 4...]
#定义空列表
变量名称=[]
变量名称=list()

name_list=['ittheima','itcast','python']
print(name_list)
print(type(name_list))
my_list=['itheima','666',True]
print(my_list)
print(type(my_list))
list=[[1,2,3],[4,5,6]]
print(list)
print(type(list))

name_list=['Tom','Lily','Rose']
print(name_list[0])
print(name_list[1])
print(name_list[2])

name_list=['Tom','Lily','Rose']
print(name_list[-1])
print(name_list[-2])
print(name_list[-3])

#嵌套列表根据索引获取元素
my_list=[[1,2,4],[4,5,6]]

#获取内层第一个 list
print(my_list[0])    #结果：[1,2,3]

#获取内层第一个 list 的第一个元素
print(my_list[0][0]) #结果：1

my_list=["iteima","itcast","python"]
print(my_list.index("itcast"))   #结果：1

#正向下标
my_list=[1,2,4]
my_list[0]=5
print(my_list)

#反向下标
my_list=[1,2,4]
my_lsit[-3]=5
print(my_list)

my_list=[1,3,4]
my_list.insert(1,"iteima")
print(my_list)  #结果：[1,ithema,3,4]

my_list=[1,2,3]
my_list.append(4)
print(my_list)   #结果：[1,2,3,4]
#嵌套列表
my_list=[1,2,3]
my_list.append([4,5,6])
print(my_list)   #结果：[1,2,3,[4,5,6]]

my_list=[1,2,3]
my_list.extend([4,5,6])
print(my_list)   #结果：[1,2,3,4,5,6]

my_list=[1,2,3]

#方式 1
del my_list[0]   #结果 [2,3]
print(my_list)

#方式 2
my_list=[1,2,3]
my_list.pop(0)
print(my_list)   #结果 [2,3]

my_list=[1,2,3,2,3]
my_list.remove(2)
print(my_list)    #结果：[1,3,2,3]

my_list=[1,2,3]
my_list.clear()
print(my_list)    #结果：[]

my_list=[1,1,1,1,2,3]
print(my_list.count(1))  #结果：3

my_list=[1,2,3,4,5] 
print(len(my_list))    #结果 5

index=0
while index<len(列表):
    元素=列表 [index]
    对元素进行处理
    index+=1

for 临时变量 in 数据容器:
    对临时变量进行处理

#定义字面量元组
(元素，元素，...，元素)
#定义元组变量
变量名称=(元素，元素，...,元素)
#定义空元组
变量名称=()
变量名称=tuple()
#定义嵌套元组 
t1=((1,2,3),(1,2,3))
print(t1[0][0])

#根据下标（索引）取出数据
t1=(1,2,'hello')
print(t1[2])   #结果是 hello

#根据 index() 方法查找特定元素的下标索引
t1=(1,2,'hello',3,4,'hello')
print(t1.index('hello')) #结果是 2

#统计某个数据在元组内出现的次数
t1=(1,2,4)
print(len(t1))

#while 循环遍历
my_tuple=(1,2,3)
index=0
while index<len(my_tuple):
    print(my_tuple[index])
    index+=1
#for 循环遍历
for i in my_tuple:
    print(i)

my_str="itcast and itheima"
print(my_str.index("and"))      #结果 7

name="zhangsan"
new_name=name.replace("zhang","lisi")

print(name)  #zhangsan
print(new_name)  #lisisan

#字符串去前后空格
my_str=" zhangsan "
print(my_str.strip())   #zhangsan

#去前后指定字符串
my_str="12zhangsna and lisi21"
print(my_str.strip("12"))   #zhangsan and lisi
#注意传入的 12，其实就是'1'，'2'都会移除

my_str="zhangsan and lisi"
print(my_str.count("li"))    #结果  1

my_str="1234 abcd !@#$ zhangsan"

print(len(my_str))   #23

#划分字符串
str="hello world zhangsan lisi wanger"
str_list=str.split()#以空格划分
print(str_list)
#["hello","world","zhangsan","lisi","wanger"]

my_list=[1,2,3,4,5]
new_list=my_list[1:4]       #下标 1 开始，下标 4(不含) 结束，步长 1
print(new_list)             #结果 [2,3,4]

my_tuple=(1,2,3,4)
new_tuple=my_tuple[:]      #从头开始，到最后结束，步长为 1
print(new_tuple)           结果 (1,2,3,4)

my_str="12345"
new_str=my_str[::2]       #从头开始，到最后结束，步长为 2
print(new_str)            #结果 [1,3,5]

#定义集合字面量
{元素 1，元素 2，元素 3...,元素 4}
#定义集合变量
变量名称={元素，元素，元素...,元素}
#定义空集合
变量名称=set()

names={"zhangsan","lisi","wanger","zhaoliu","zhangsan"}
print(names) 
#结果：lisi,wanger,zhangsan,zhaoliu

my_set={"hello","world"}
my_set.add("zhangsan")
print(my_set)
#结果：{hello,zhangsan,world}

my_set={"hello","world","zhangsan"}
my_set.remove("hello")
print(my_set)
#结果：{"world","zhangsan"}

my_set={"hello","world","zhangsan"}
element=my_set.pop()
print(my_set)
print(element)

my_set={"hello","world","张三"}
my_set.clear()
print(my_set)

set1={1,2,3}
set2={1,5,6}
set3=set1.difference(set2)
print(set1)   #结果： {1，2,3}
print(set2)     #结果： {1,5,6}
print(set3)   #结果： {2,3}

set1={1,2,3}
set2={1,5,6}
set1.difference_update(set2)
print(set1)    #结果： {2,3}
print(set2)    #结果： {1,5,6}

set1={1,2,3}
set2={1,5,6}
set3=set1.union(set2)
print(set1)     #结果： {1,2,3}
print(set2)     #结果： {1,5,6}
print(set3)     #结果： {1,2,3,6,5}

set1={1,2,3}
print(len(set1))  #结果 3

#定义字典字面量
{key:value,key:value,...,key:value}
#定义字典变量
my_dict={key:value,key:value,...,key:value}
#定义空字典
my_dict={}
my_dict=dict()

#记录学生的成绩
stu_score={"张三":90,"李四":25,"赵一":89}

stu_score={"张三":90,"李四":25,"赵一":89}
print(stu_score["张三"])
print(stu_score["李四"])
print(stu_score["赵一"])

stu_score={
    "王力鸿":{"语文":77,"数学":66,"英语":33},
    "周杰轮":{"语文":88,"数学":86,"英语":55},
    "林俊节":{"语文":99,"数学":89,"英语":66}
}
print(stu_score)
#嵌套列表的取值
print(stu_score["王力鸿"])
print(stu_score["王力鸿"]["语文"])
print(stu_score["王力鸿"]["数学"])

stu_score={
    "王力鸿":77,
    "周杰轮":88,
    "林俊节":89
}
stu_score['张三']=89
print(stu_score)

stu_score={
    "王力鸿":77,
    "周杰轮":88,
    "林俊节":89
}
value=stu_score.pop("王力鸿")
print(value)
print(stu_score)

stu_score={
    "王力鸿":77,
    "周杰轮":88,
    "林俊节":89
}
stu_score.clear()
print(stu_score)

stu_score={
    "王力鸿":77,
    "周杰轮":88,
    "林俊节":89
}
keys=stu_score.keys()
print(keys)    结果：dict_keys{["王力鸿","周杰轮","林俊节"]}

stu_score={
    "王力鸿":77,
    "周杰轮":88,
    "林俊节":89
}
print(len(stu_score))

def test_return():
    return 1, 2
x,y=test_return()
print(x)
print(y)

def user_info(name,age,gender):
    print(f"您的名字是{name},年龄是{age},性别是{gender}")
user_info("TOM",20,"男")

def user_info(naem,age,gender):
   print(f"您的名字是{name},年龄是{age},性别是{gender}")

user_info(name="张三",age=56,gender="男")

def user_info(name, age, gender="男"):
    print(f"您的名字是{name},年龄是{age},性别是{gender}")
  
user_info("TOM",45)

def user_info(*args):
    print(args)
    
user_info("TOM")
user_info("TOM",45)
#需要注意。传进去的参数会被 args 变量收集，他会根据传进的参数的位置合并为一个元组

def user_info(**kwargs):
    print(kwargs)
user_info(name="TOM",age=56,id=1001)
#使用关键字传递参数是以'键=值'形式传参，所有的'键=值'都会被 kwargs 接受，同时组成字典

def test_function(compute):
    result=compute(1,2)
    print(result)
    
def compute(x,y):
    return x+y

test_function(compute)

def test_func(compute):
    result=compute(1,2)
    print(result)
#传入一个一次性使用的 lambda 匿名函数，函数作为参数传递的是计算逻辑
test_func(lambda x,y:x+y)

#`f`是`open`函数的文件对象，对象是 Python 中一种特殊的数据类型，拥有属性和方法，可以使用对象。属性或对象。方法对其进行访问，
f=open("D:/123.txt","r",encoding="UTF-8")

f = open("D:/学习资料/python/123.txt")
content = f.readlines()
print(content)
print(type(content))
f.close()

f = open("D:/学习资料/python/123.txt")
content = f.readline()
print(f"第一行{content}")
print(type(content))
content = f.readline()
print(f"第二行{content}")
print(type(content))
f.close()

for line in open("D:/学习资料/python/123.txt", "r"):
    print(line)

with open("D:/学习资料/python/123.txt", "r") as f:
    print(f.readlines())

# 打开文件
f=open("D:/学习资料/python/123.txt","w")
# 文件的写入
f.write("helloWorld")
# 内容的刷新
f.flush()
f.close()

#打开文件
f=open("D:/学习资料/python/123.txt","a")
#文件追加写入
f.write("zhangsan")
#内容的刷新
f.flush()
#关闭文件
f.close()

f=open("D:/学习资料/python/13.txt","r")

"""
	基本语法：
	try:
    	可能发生错误的代码
	except:
    	如果出现异常执行的代码
"""
#尝试以`r`模式打开文件，如果文件不存在，则以`w`方式打开。
try:
    f = open('linux.txt', 'r')
except:
    f = open('linux.txt', 'w')

"""
	基本语法:
	try:
    	print(name)
	except NameError as e:
    	print('name 变量名称未定义错误')
"""

try:
    print(1/0)
except (NameError, ZeroDivisionError):
    print('ZeroDivision 错误...')

try:
    print(num)
except (NameError, ZeroDivisionError) as e:
    print(e)

try:
    print(name)
except Exception as e:
    print(e)

try:
    print(1)
except Exception as e:
    print(e)
else:
    print('我是 else，是没有异常的时候执行的代码')

try:
    f = open('test.txt', 'r')
except Exception as e:
    f = open('test.txt', 'w')
else:
    print('没有异常，真开心')
finally:
    f.close()

"""
	基本语法
	import 模块名
	import 模块名 1，模块名 2
	模块名。功能名 ()
"""
#导入 time 模块
# 导入时间模块
import time
print("开始")
# 让程序睡眠 1 秒 (阻塞)
time.sleep(1)
print("结束")

"""
	基本语法：
	from 模块名 import 功能名
	功能名 ()
"""
# 导入时间模块中的 sleep 方法
from time import sleep
print("开始")
# 让程序睡眠 1 秒 (阻塞)
sleep(1)
print("结束")

"""
	from 模块名 import *
	功能名 ()
"""
# 导入时间模块中所有的方法
from time import *
print("开始")
# 让程序睡眠 1 秒 (阻塞)
sleep(1)
print("结束")

"""
	# 模块定义别名
	import 模块名 as 别名

	# 功能定义别名
	from 模块名 import 功能 as 别名
"""
# 模块别名
import time as tt
tt.sleep(2)
print('hello')
# 功能别名
from time import sleep as sl
sl(2)
print('hello')

def test(a, b):
    print(a + b)

# 只在当前文件中调用该函数，其他导入的文件内不符合该条件，则不执行 test 函数调用
if __name__ == '__main__':
    test (1, 1)

__all__=['testA']

def testA():
    print("testA")
  
def testB():
    print("testB")
---------------------
from moudle1 import *
testA()
此时只能使用 testA() 方法

"""
	方式 1
	import 包名。模块名
	包名。模块名。目标
	
	方式二：from 包名 import *
"""

class Student:
    name=None   #记录学生的姓名

#基于类创建对象
stu_1=Student()
stu_2=Student()

stu_1.name="zhangsan"
stu_2.name="李四"

class:
    类的属性 #类的属性即定义在类中的变量
    类的行为 #类的行为即定义在类中函数，也称做方法，注意写在类外面的函数不能叫方法
#创建类对象的语法
对象。类名称 ()

class Student:
    name=None
    age=None
    #定义方法，与传统函数定义不同，参数中必须要写 self 关键     #字，表示自身的意思，在方法内部访问类成员的变量，必须也     #要使用 self.成员变量，在传参的过程中不用理会 self，它是     #透明的
    def say_hi(self):
        print(f"helloworld，我是 (self.name)")
#新建类对象
stu=Student()
#为类属性赋值
stu.name="张三"
#调用类方法
stu.say_hi()

#设计闹钟
class Clock:
    #设计属性
    id=None
    price=None
    #设计响铃行为
    def ring(self):
        import winsound
        winsound.Beep(2000,3000)
        
#基于类创建对象
clock1=Clock()
clock1.id=1001
clock1.price=19.00
print("闹钟 id 是{clock1.id},价格是{clock1.price}")
clock1.ring()

#基于类创建对象
clock2=Clock()
clock2.id=1001
clock2.price=19.00
print("闹钟 id 是{clock2.id},价格是{clock2.price}")
clock2.ring()

class Student:
    #这一部分可以省略，构造方法会根据参数申明成员变量并赋值
    name=None
    age=None
    tel=None
    
    def __init__(self,name,age,tel):
        self.name=name
        self.age=age
        self.tel=tel
        print("student 类创建了一个类对象")
stu=Student("zhangsan",15,111110)

class Student:
    def __init__(self,name,age):
        self.name=name
        self.age=age
    #定义__str()__方法
    def __str__(self):
        return f"student 类对象，name={self.name},age={self.age}"
    
student=Student("zhangsna",21)
print(student)      #结果：student 类对象，name=zhangsna,age=21
print(str(student)) #结果：student 类对象，name=zhangsna,age=21

class Student:
    def __init__(self,name,age):
        self.name=name
        self.age=age
    def __lt__(self,other):
        return self.age<other.age
    
stu1=Student("张三",11)
stu2=Student("李四",25)
print(stu1<stu2)  结果：True
print(stu1>stu2)  结果：False

class Student:
    def __init__(self,name,age):
        self.name=name
        self.age=age
    def __le__(self,other):
        return self.age<=other.age
    
stu1=Student("张三",11)
stu2=Student("李四",25)
print(stu1<=stu2)  结果：True
print(stu1>=stu2)  结果：False

class Student:
    def __init__(self,name,age):
        self.name=name
        self.age=age
    def __eq__(self,other):
        return self.age==other.age
    
stu1=Student("张三",11)
stu2=Student("李四",25)
print(stu1==stu2)  结果：True
print(stu1==stu2)  结果：False

#私有成员变量：__变量名
#私有成员方法：__方法名
class Phone:
    IMEI=None  #序列号
    price=None #价格
    __current_voltage=None  #私有成员变量，当前电压
    #私有成员方法
    def __keep_single_core(self):
        print("单核模式运行")
        
    def call_by_5g(self):
        if self.__current_voltage>=1:
        	print("开启 5G")
         else:
            __keep_single_core()
            print("电量不足，不能开启 5G")
            
phone=Phone("1001",10)
phone.call_by_5g()

class 类名 (父类):
    子类新添加的内容

#单继承  继承表示从父类那里继承（复制）成员变量和成员方法
class Phone:
    IMEI=None    #序列号
    producer="HM"  #厂商
    
    def call_by_4g(self):
        print("4g 通话")
        
class Phone2022(Phone):
    face_id=True   #面部识别
    
    def call_by_5g(self):
        print("2022 最新 5g 通话")
phone=Phone2022()
print(phone.producer)
phone.call_by_4g()
phone.call_by_5g()

class 类名 (父类 1，父类 2,...,父类 N):
    子类新添加的内容

#手机基本信息
class Phone:
    IMEI=None    #序列号
    producer="HM"  #厂商
    
    def call_by_5g(self):
        print("5g 通话")
#NFC 读卡
class NFCReader:
    nfc_type="第五代"
    producer="HM"
    def read_card(self):
        print("读取 NFC")
    def write_card(self):
        print("写入 NFC")
        
#红外遥控
class RemoteControl:
    rc_type="红外遥控"
    def control(self):
        print("红外遥控开启")
        
#我的手机
class MyPhone(Phone,NFCReader,RemoteControl):
    pass  #pass 关键字用于子类继承后不想添加新内容，但语法有要求写些什么的替代
phone=MyPhone()
phone.call_by_5g()
phone.read_card()
phone.write_card()
phone.control()
print(phone.producer)  #在输出同名属性时，继承在前面的被输出

class Phone:
    IMEI=None    #序列号
    producer="HM"  #厂商
    
    def call_by_5g(self):
        print("5g 通话")
class MyPhone(Phone):
    producer="HW"
    
    def call_by_5g(self):
        print("子类复写的 5g 通话")
phone=MyPhone()
phone.call_by_5g()
print(phone.producer)
#如果在子类中有特殊要求需要调用被复写的父类变量或父类方法
"""
	方式 1：父类名。成员变量
	      父类名。成员方法 (self)
	方式 2：super().成员变量
	      super().成员方法 ()
"""

#基础数据类型注解
var_1:int=10
var_2:float=3.1415926
var_1:str=abc
    
#类对象类型注解
class Student:
    pass
stu:Student=Student()
#基础数据容器类型注解
my_list:list=[1.2,3]
my_tuple:tuple=(1,2,3)
my_set:set={1,2,3}
my_dict:dict={"zhangsan":20}
    
#基础容器类型详细注解，元组类型设置详细注解，需要将每一个元素都标记出来，字典类型设置类型详细注解，需要 2 个类型，第一个时 key，第二个时 value
my_list:list[int]=[1,2,3]
my_tuple:tuple[int]=(1,2,3)
my_set:set[int]={1,2,3}
my_dict:dict[str,int]={"zhangsan":20}
#函数（方法）的类型注解  基本语法：
"""
	def 函数（方法）名 (形参名：类型，形参名：类型)：
		pass
"""
def add(x:int,y:int):
    return x+y
def func(data:list):
    pass
#函数（方法）返回值添加注解
"""
	基本语法：
	def 函数（方法）名 (形参名：类型，形参名：类型)->返回值类型：
		pass
	
"""

"""
	基本语法：Union[类型，类型...]
"""
#使用 Union 类型需要导入相关包
from typing import Union
my_list:list[Union[str,int]]=[1,2,"zhangsan"]
my_dict:dict[str,Union[str,int]]={"name":"zhangsan","age":23}

def func(data:Union[int,str])->Union[int,str]:
    pass

class Animal:
    def speak(self):
        pass
class Dog(Animal):
    def speak(self):
        print("汪汪汪")
class Cat(Animal):
    def speak(self):
        print("喵喵喵")
def make_noise(animal:Animal):
    animal.speak()
    
dog=Dog()
cat=Cat()
make_noise(dog)
make_noise(cat)

"""
	抽象类 + 多态完成
	抽象的父类设计
	具体的子类来实现
"""
#定义空调标准
class AC:
    #制冷
    def cool_wind(self):
        pass
    #制热
    def hot_wind(self):
        pass
    #摆风
    def swing(self):
        pass
    
#美的生产厂商
class Midea_AC(AC):
    def cool_wind(self):
        print("美的核心制冷技术")
    def hot_wind(self):
        print("美的核心制热技术")
    def swing(self):
        print("美的核心摆风技术")
#格力生产厂商
class GEREE_AC(AC):
    def cool_wind(self):
        print("格力核心制冷技术")
    def hot_wind(self):
        print("格力核心制热技术")
    def swing(self):
        print("格力核心摆风技术")

def make_cool(ac:AC):
    ac.cool_wind()
midea=Midea_AC()
geree=GEREE_AC()

make_cool(midea)
make_cool(geree)

"""
    在函数嵌套的前提下，内部函数使用了外部函数的变量，
    并且外部函数返回了内部函数，我们把这个使用外部函
    数变量的内部函数称为闭包。
"""
#外部函数
def outer(logo):
    #内部函数
    def inner(msg):
        print(f"<{msg}><{logo}><{msg}>")
    #返回内部函数
    return inner
#定义 fn1 变量为 inner 函数，
# 同时对于 inner 函数"logo"变量为"张三",该值很能直接被修改
fn1=outer("张三")
#李四为 msg 的参数
fn1("李四")

def outer(num1):
    def inner(num2):
        nonlocal num1
        num1+=num2
        print(num1)
    return inner

fn=outer(10)
fn(10)
fn(10)

"""
    定义一个闭包函数，在闭包函数内部：
    执行目标函数
    并完成功能的添加
"""
import random
import time

def outer(func):
    def inner():
        print("我要睡觉了")
        func()
        print("我起床了")
    return inner
def sleep():
    print("睡眠中")
    time.sleep(random.randint(1,5))
fn=outer(sleep)
fn()

"""
    使用@outer
    定义在目标函数 sleep 之上

"""
import random
import time

def outer(func):
    def inner():
        print("我要睡觉了")
        func()
        print("我起床了")
    return inner
@outer
def sleep():
    print("睡眠中")
    time.sleep(random.randint(1,5))

sleep()

#在一个文件中定义一个类对象
class StrTools:
    pass
#定义了一个类对象
str_tool=StrTools()
-----------------------
#在另一个文件中导入第一个文件中类对象
from 单例模式 import str_tool

s1=str_tool
s2=str_tool
print(s1)
print(s2)
#此时 s1 和 s2 的地址是一样的，说明就是同一个对象

"""
    使用工厂类的 get_person() 方法去创建具体的类对象
    优点：
    大批量创建对象的时候有统一的入口，易于代码维护
    当发生修改，仅修改工厂类的创建方法即可
    符合现实世界的模式，即由工厂来制作产品（对象）
"""
class Person:
    pass
class Worker(Person):
    pass
class Teacher(Person):
    pass
class Student(Person):
    pass
#定义工厂类
class Factory:
    def getperson(self,p_type):
        if p_type=='w':
            return Worker()
        elif p_type=='s':
            return Student()
        else:
            return Teacher()
factory=Factory()
worker=factory.getperson('w')
student=factory.getperson('s')
teacher=factory.getperson('t')

import threading

"""
    thread_obj=threading.Thread([group[,target[,name[,arg[,args[,kwargs]]]]])
    group:无意义，未来功能预留参数
    target:执行的目标任务名
    args:以元组的方式给执行任务传参
    kwargs:以字典的方式给任务传参
    name:线程名，一般不用设置
    启动线程
    thread_obj.start()
"""
def sleep():
    while True:
        print("我在睡觉，zzzz")
def sing():
    while True:
        print("我在唱歌，啦啦啦啦")

sing_thread=threading.Thread(target=sing)
sleep_thread=threading.Thread(target=sleep)

sleep_thread.start()
sing_thread.start()

import threading

def dance(msg):
    while True:
        print(msg)
#args 通过元组传参
dance_thred=threading.Thread(target=dance,args=("我在跳舞，哈哈哈哈",))
dance_thred.start()

#kwarges 通过字典传参
dance_thread=threading.Thread(target=dance,kwargs={"msg":"我想跳舞"})
dance_thread.start()

"""
    主要分为如下几个步骤：
    1. 创建 socket 对象
    2. 绑定 socket_server 到指定 IP 和地址
    3.  服务端开始监听端口
    4.  接收客户端连接，获得连接对象
    5. 客户端连接后，通过 recv 方法，接收客户端发送的消息
    6. 通过 conn（客户端当次连接对象），调用 send 方法可以回复消息
    7. conn（客户端当次连接对象）和 socket_server 对象调用 close 方法，关闭连接
"""
import socket

# 创建 socket 对象
socket_server = socket.socket()
# 绑定 socket_server 到指定 IP 和地址，bind(IP 地址，端口号)
socket_server.bind(("192.168.50.196", 8888))
# 服务端开始监听端口 linsten() 中传入允许连接的数量，不填会默认设置一个合理值
socket_server.listen(1)
# 接收客户端连接，获得连接对象
conn, address = socket_server.accept()
#accept() 方法是阻塞方法，会一直等待执行，需传入缓冲区大小
print(f"接受到客户端连接，来自：{address}")
#客户端连接后，通过 recv 方法，接收客户端发送的消息
while True:
    data=conn.recv(1024).decode("UTF-8")
    #recv() 方法是阻塞方法，会一直等待执行，需传入缓冲区大小
    if data=='exit':
        break
    print(f"接受客户端发来的的数据{data}")
    #通过 conn（客户端当次连接对象），调用 send 方法可以回复消息
    conn.send(input("请输入要发送的数据").encode("UTF-8"))
#conn（客户端当次连接对象）和 socket_server 对象调用 close 方法，关闭连接
conn.close()
socket_server.close()

"""
    主要分为如下几个步骤：
    1. 创建 socket 对象
    2. 连接到服务端
    3. 发送消息
    4. 接收返回消息
    5. 关闭链接
"""
import socket
#创建 socket 对象
socket_client=socket.socket()
#连接到服务端
socket_client.connect(("192.168.50.196",8888))
#发送消息
while True:
    send_msg=input("要发送的消息")
    if send_msg=='exit':
        break
    socket_client.send(send_msg.encode("UTF-8"))
    #接收返回消息
    recv_data=socket_client.recv(1024).decode("UTF-8")
    #recv() 方法是阻塞方法，会一直等待执行，需传入缓冲区大小
    print(f"服务端返回的数据{recv_data}")
#关闭链接
socket_client.close()

import re

s='zhangsan lisi wanger zhaoliu tangyi'
result=re.match('zhangsan',s)
print(result)   #<re.Match object; span=(0, 8), match='zhangsan'>
print(result.span())  #(0, 8)
print(result.group()) #zhangsan
result1=re.match('lisi',s)
print(result1)   #None

import re
s='1zhangsan5555lisi565'
result=re.search('zhangsan',s)
print(result)     #<re.Match object; span=(1, 9), match='zhangsan'>
print(result.span())   #(1, 9)
print(result.group())  #zhangsan
result2=re.search('python',s)
print(result2)   #None

import re
s='1zhangsan66666lisi78787zhangsan999zhangsan'
result=re.findall('zhangsan',s)
print(result)
print(type(result))

import re
s='zhangsan9090@#@lisizhangsan'
#找出全部非单词字符
result=re.findall(r'\W',s)
print(result)
print(type(result))
#找出全部英文字母
result1=re.findall(r'[a-zA-Z]',s)
print(result1)

"""
	def func()
		if...:
			func()
		return ...
"""

from pymysql import Connection
#获取到 mySQL 数据库的连接对象
conn=Connection(
    host='localhost',
    port=3306,
    user='root',
    password='123456'
)
#打印 MySQL 数据库软件信息
print(conn.get_server_info())
#关闭连接
conn.close()

#导入第三方包
from pymysql import Connection
#获取 sql 连接对象
conn=Connection(
    host='localhost',
    port=3306,
    user='root',
    password='123456'
)
#获取游标对象
cursor=conn.cursor()
#选择要使用的数据库
conn.select_db("test")
#使用游标对象执行 sql 语句
cursor.execute("create table test_py_mysql(id int,info varchar(255))")

#关闭数据库连接
conn.close()

#导入第三方包
from pymysql import Connection
#获取 sql 连接对象
conn=Connection(
    host='localhost',
    port=3306,
    user='root',
    password='123456',
    autocommit=True   #设置自动提交
)
#获取游标对象
cursor=conn.cursor()
#选择要使用的数据库
conn.select_db("test")
#使用游标对象执行 sql 语句
cursor.execute("insert into user values ('周杰轮',23,'123456','男')")
#在执行 sql 数据插入或其它生产数据更改的 sql 语句时，需要通过提交才能完成更改行为
#提交修改
conn.commit()
#关闭数据库连接
conn.close()

#导入第三方包
from pyspark import SparkConf,SparkContext
#获取 Spark 对象
conf=SparkConf().setMaster("local[*]").setAppName("test_spark_app")
#基于 Spark 类对象获取 SparkContext 对象
sc=SparkContext(conf=conf)
#进行数据容器转换
list=[1,2,3,4,5,6,7,8]
#parallelize() 方法中传入数据容器对象，返回值是 list
rdd=sc.parallelize(list)
#输出 rdd 内容
print(rdd.collect())
#关闭 PySpark 程序
sc.stop()

#导入第三方包
from pyspark import SparkConf,SparkContext
#获取 spark 对象
conf=SparkConf().setMaster("local[*]").setAppName("test_spark_app")
#通过 conf 类对象获取 sparkContext 对象
sc=SparkContext(conf=conf)
#将文件转换为 rdd,textFile() 方法中传入文件路径，返回值是列表
rdd=sc.textFile("D:/学习资料/python/123.txt")
#打印 rdd 对象
print(rdd.collect())
#关闭 PySpark 程序
sc.stop()

"""
    map(func)
    func:f:(T)->U
    (T)->(U) 表示传入一个任意参数，返回一个任意参数
    拓展
    (A)->(A) 表示传入一个参数，返回一个与传入参数类型一致的参数
"""
#导入第三方包
from pyspark import SparkConf,SparkContext
#配置 Spark 读取到 python 解释器
import os
os.environ['PYSPARK_PYTHON']="D:/学习工具/python.exe"
#测试
if __name__=="__main__":
    #获取 Spark 对象
    conf=SparkConf().setMaster("local[*]").setAppName("test_spark")
    #获取 SprkContext 对象
    sc=SparkContext(conf=conf)
    #设置 rdd 对象
    rdd=sc.parallelize([1,2,3,4,5])
    #定义需要作为参数的方法 还可以使用 lamba 匿名函数定义
    def map_func(data):
        return data*10
    #输出 map 算子处理后的结果
    print(rdd.map(map_func).collect())
    #关闭 spark 程序
    sc.stop()

#导入第三方包
from pyspark import SparkConf,SparkContext
#配置 Spark 读取到 python 解释器
import os
os.environ['PYSPARK_PYTHON']="D:/学习工具/python.exe"
#获取 spark 对象
conf=SparkConf().setMaster("local[*]").setAppName("test_spark")
#获取 SparkContext 对象
sc=SparkContext(conf=conf)
#设置 rdd 对象
rdd=sc.parallelize(["a b c","e f g","h i j"])
#按照空格切分数据后，解除嵌套
print(rdd.flatMap(lambda x:x.split(" ")).collect())
#关闭 spark 程序
sc.stop()

"""
    rdd.reduceByKey(func)
    #func:(V,V)->V
    #接受 2 个传入参数（类型要一致），返回一个返回值，类型和传入要求一致
    reduceByKey 中接受的函数只负责聚合，不负责分组，分组是自动 by Key 来分组的
"""
#导入第三方包
from pyspark import SparkConf,SparkContext
#配置 Spark 读取到 python 解释器
import os
os.environ['PYSPARK_PYTHON']="D:/学习工具/python.exe"
#获取 spark 对象
conf=SparkConf().setMaster("local[*]").setAppName("test_spark")
#获取 SparkContext 对象
sc=SparkContext(conf=conf)
#设置 rdd 对象
rdd=sc.parallelize([('a',1),('a',1),('b',1),('b',1),('a',1)])
#reduceByKey() 算子处理 rdd
result=rdd.reduceByKey(lambda a,b:a+b)
#输出处理结果
print(result.collect())
#关闭 spark 程序
sc.stop()

"""
    rdd.filter(func)
    func:(T)->bool
    传入一个任意类型的参数，返回值为 False 或者 True
"""
#导入第三方包
from pyspark import SparkConf,SparkContext
#配置 Spark 读取到 python 解释器
import os
os.environ['PYSPARK_PYTHON']="D:/学习工具/python.exe"
#获取 spark 对象
conf=SparkConf().setMaster("local[*]").setAppName("test_spark")
#获取 SparkContext 对象
sc=SparkContext(conf=conf)
#获取 rdd 对象
rdd=sc.parallelize([1,2,3,4,5])
#使用 filter 方法保留奇数
print(rdd.filter(lambda x:x%2==1).collect())
#关闭 spark 程序
sc.stop()

"""
    语法：rdd.distinct() 无需传参
"""
#导入第三方包
from pyspark import SparkConf,SparkContext
#配置 Spark 读取到 python 解释器
import os
os.environ['PYSPARK_PYTHON']="D:/学习工具/python.exe"
#获取 spark 对象
conf=SparkConf().setMaster("local[*]").setAppName("test_spark")
#获取 SparkContext 对象
sc=SparkContext(conf=conf)
#获取 rdd 对象
rdd=sc.parallelize([1,2,3,2,3,1,3,2,1])
#对 rdd 对象进行去重操作
print(rdd.distinct().collect())
#关闭 spark 程序
sc.stop()

rdd.sortBy(func,ascending=False,numPartitons=1)
"""
	func:(T)->U  告知按照 rdd 中的哪个数据进行排序
	ascending True 表示升序
	nunPatition 表示用多少分区排序
"""

"""
    rdd.reduce(func)
    func:(T,T)->T
    2 个参数传入，1 个返回值，返回值的参数要求和传入的参数保持一致
"""
#导入第三方包
from pyspark import SparkConf,SparkContext
#配置 Spark 读取到 python 解释器
import os
os.environ['PYSPARK_PYTHON']="D:/学习工具/python.exe"
#获取 spark 对象
conf=SparkConf().setMaster("local[*]").setAppName("test_spark")
#获取 SprkContext 对象
sc=SparkContext(conf=conf)
#获取 rdd 对象
rdd=sc.parallelize(range(1,10))
#将 rdd 数据进行累加求和
print(rdd.reduce(lambda a,b:a+b))

#导入第三方包
from pyspark import SparkConf,SparkContext
#配置 Spark 读取到 python 解释器
import os
os.environ['PYSPARK_PYTHON']="D:/学习工具/python.exe"
#获取 spark 对象
conf=SparkConf().setMaster("local[*]").setAppName("test_spark")
#获取 SparkContext 对象
sc=SparkContext(conf=conf)
#获取 rdd 对象
rdd=sc.parallelize([3,2,1,5,7,8])
#返回前 4 个数据
print(rdd.take(4))

#导入第三方包
from pyspark import SparkConf,SparkContext
#配置 Spark 读取到 python 解释器
import os
os.environ['PYSPARK_PYTHON']="D:/学习工具/python.exe"
#获取 spark 对象
conf=SparkConf().setMaster("local[*]").setAppName("test_spark")
#获取 SparkContext 对象
sc=SparkContext(conf=conf)
#获取 rdd 对象
rdd=sc.parallelize([3,2,1,4,5,6])
#返回 rdd 对象中有多少个数据
print(rdd.count())

"""
    修改 rdd 分区的方式有两种，
    方式 1：SparkConf().setMaster("local[*]").setAppName("test_spark")
    设置默认分区为 1 个
    conf.set("spark.default.parallelism","1")
    方式 2:创建 rdd 的时候设置（parallelize 方法传入 numSlices 参数为 1）
    rdd=sc.parallelize([1,2,3,4],numSlice=1)
"""

#导入第三方包
from pyspark import SparkConf,SparkContext
#创建 SparkConf 类对象
conf=SparkConf().setMaster("local[*]").setAppName("test_spark_app")
#基于 SparkConf 类对象创建 SparkContext 类对象
sc=SparkContext(conf=conf)
#打印 pyspark 的运行版本
print(sc.version)
#关闭 PySpark 程序
sc.stop()

# json 数据的格式可以是： 
{"name":"admin","age":18} 
# 也可以是：  
[{"name":"admin","age":18},{"name":"root","age":16},{"name":"张三","age":20}] 

# 导入 json 模块
import json
# 准备符合格式 json 格式要求的 python 数据
data = [{"name": "老王", "age": 16}, {"name": "张三", "age": 20}]
# 通过 json.dumps(data) 方法把 python 数据转化为了 json 数据
data = json.dumps(data,ensure_ascii=False)
#ensure_ascii=False 表明不使用 ascii 码转换
print(data)
print(type(data))
# 通过 json.loads(data) 方法把 json 数据转化为了 python 数据
data1 = json.loads(data)
print(data1)
print(type(data))

#导入折线图功能
from pyecharts.charts import Line
#得到折线图对象
line=Line()
#添加 x 轴数据
line.add_xaxis(["中国","美国","英国"])
#添加 y 轴数据
line.add_yaxis("GDP",[30,40,59])
#生成图标，注意它会生成一个前端页面
line.render("折线图.html")

#导入折线图功能
from pyecharts.charts import Line
#使用全局设置需要导入相关包
from pyecharts.options import *
#得到折线图对象
line=Line()
#全局配置，全局设置过程中各个属性的设置需要用逗号隔开
line.set_global_opts(
    #配置图表标题
    title_opts=TitleOpts(title="测试",pos_left="center",pos_bottom="1%"),
    #设置图例配置表
    legend_opts=LegendOpts(is_show=True),
    #工具箱配置表
    toolbox_opts=ToolboxOpts(is_show=True),
    #视觉映射配置项
    visualmap_opts=VisualMapOpts(is_show=True),
    #提示框配置项
    tooltip_opts=TooltipOpts(is_show=True)
)
#添加 x 轴数据
line.add_xaxis(["中国","美国","英国"])
#添加 y 轴数据
line.add_yaxis("GDP",[30,40,59])
#生成图标，注意它会生成一个前端页面
line.render("折线图.html")

#导入 json 模块
import json
#打开要处理的数据文件
f=open("D:/学习资料/python/课件/课件/资料/资料/可视化案例数据/折线图数据/美国.txt","r",encoding="UTF-8")
data=f.readlines()
print(data)
# 把不符合 json 数据格式的 "jsonp_1629350871167_29498(" 去掉
data = data.replace("jsonp_1629350871167_29498(")
# 把不符合 json 数据格式的 ");" 去掉
data = data[:-2]
# 数据格式符合 json 格式后，对数据进行转化
data = json.loads(data)
# 获取美国的疫情数据
data = data["data"][0]['trend']
# x1_data 存放日期数据
x1_data = data['updateDate']
# y1_data 存放人数数据
y1_data = data['list'][0]["data"]
# 获取 2020 年的数据
x1_data = data['updateDate'][:314]
# 获取 2020 年的数据
y1_data = data['list'][0]["data"][:314]

# 导入第三方包
from pyecharts.charts import Map
from pyecharts.options import VisualMapOpts

# 获取 map 对象
map = Map()
# 设置数据，这些地区名称必须要按照地图显示的设置，否则地图上会没有数据，而且数据必须元组
data = [
    ("北京市",99),
    ("上海市", 156),
    ("湖南省", 589),
    ("台湾省", 778),
    ("安徽省", 899),
    ("广州省", 1089),
    ("湖北省", 9)
]
map.add("地图", data, "china")
#设置视觉映射器
map.set_global_opts(
    visualmap_opts=VisualMapOpts(
        is_show=True,
        is_piecewise=True,
        pieces=[
            {"min":1,"max":9,"label":"1-9","color":"#CCFFFF"},
            {"min":10,"max":99,"label":"10-99","color":"#FFFF99"},
            {"min":99,"max":499,"label":"99-499","color":"#FF9966"},
            {"min":500,"max":999,"label":"500-999","color":"#FF6666"},
            {"min":1000,"max":9999,"label":"1000-9999","color":"#CC3333"}
        ]
    )
)
# 生成地图
map.render("基本地图.html")

#导入柱状图
from pyecharts.charts import Bar
from pyecharts.options import *
#新建柱状图
bar=Bar()
#添加数据
bar.add_xaxis(["中国","美国","英国"])
bar.add_yaxis(
    "GDP",[20,30,10],
    #设置数值标签在右侧
    label_opts=LabelOpts(
        position="right"
    )
)
#反转 xy 轴
bar.reversal_axis()
#生成图表
bar.render("基本柱状图.html")

#数据处理文件
#导入 json
import json
#读取文件
f=open("D:/学习资料/python/课件/课件/第 13 章资料/2011 年 1 月销售数据.txt","r",encoding="UTF-8")
pydata=f.readlines()
f1=open("D:/学习资料/python/课件/课件/第 13 章资料/2011 年 2 月销售数据 JSON.txt","r",encoding="UTF-8")
data1=f1.readlines()
#导入 pymysql 第三方包
from pymysql import Connection
#导入处理过后的数据集
import 销售数据处理文件 as data
#导入 json
import json
#获取连接对象
conn=Connection(
    host='localhost',
    port=3306,
    user='root',
    password='123456',
    autocommit=True
)
#获取游标对象
cusor=conn.cursor()
#选择数据库
conn.select_db("test")
#执行 sql 语句
# cusor.execute("create table sale_data(year varchar(255),order_id varchar(255),sum int,location varchar(255))")
for str in data.pydata:
    year=str.split(",")[0]
    order_id=str.split(",")[1]
    sum=int(str.split(",")[2])
    location=str.split(",")[3]
    cusor.execute(f"insert sale_data values('{year}','{order_id}',{sum},'{location}')")
for dict in data.data1:
    singal_data=json.loads(dict.strip("\n"))
    year=singal_data["date"]
    order_id=singal_data["order_id"]
    sum=int(singal_data["money"])
    location=singal_data["province"]
    cusor.execute(f"insert sale_data values('{year}','{order_id}',{sum},'{location}')")

#关闭连接
conn.close()

#导入第三方包
from pyspark import SparkConf,SparkContext
#配置 Spark 读取到 python 解释器
import os
os.environ['PYSPARK_PYTHON']="D:/学习工具/python.exe"
#获取 spark 对象
conf=SparkConf().setMaster("local[*]").setAppName("test_spark")
#获取 SparkContext 对象
sc=SparkContext(conf=conf)
#将文件转化为为 rdd 对象
rdd=sc.textFile("D:/学习资料/python/课件/课件/第 15 章资料/资料/hello.txt")
#将所有的单词都取出来
words=rdd.flatMap(lambda x:x.split(" "))
#将所有单词都加上 1 作为 value
words_one=words.map(lambda x:(x,1))
#对单词分组并求和
result=words_one.reduceByKey(lambda a,b:a+b)
#打印输出的的结果
print(result.collect())
#关闭 spark 程序
sc.stop()

#导入第三方包
from pyspark import SparkConf,SparkContext
import json
#配置 Spark 读取到 python 解释器
import os
os.environ['PYSPARK_PYTHON']="D:/学习工具/python.exe"
#获取 spark 对象
conf=SparkConf().setMaster("local[*]").setAppName("test_spark")
#获取 SparkContext 对象
sc=SparkContext(conf=conf)
#获取 rdd 对象
items=sc.textFile("D:/学习资料/python/课件/课件/第 15 章资料/资料/orders.txt")
#按照 | 划分
items_split=items.flatMap(lambda x:x.split("|"))
#将每个 json 字符串转换为字典对象
items_dict=items_split.map(lambda x:json.loads(x))
#统计各个城市的销售额
items_city_sum=items_dict.map(lambda x:(x["areaName"],int(x["money"])))
items_city_sum=items_city_sum.reduceByKey(lambda a,b:a+b)
#对城市销售额进行排序
items_city_sum.sortBy(lambda x:x[1],ascending=False,numPartitions=1)
#输出排序结果
print(f"销售额排名为{items_city_sum.collect()}")
#统计各个城市所卖的商品
items_sale=items_dict.map(lambda x:x["category"])
#对所卖的商品进行去重
items_sale=items_sale.distinct()
#所卖的商品类别有
print(f"所卖的商品类别有{items_sale.collect()}")
#统计北京市所卖的商品
items_beijin=items_dict.map(lambda x:(x["areaName"],x["category"]))
#过滤保留北京数据
items_beijin=items_beijin.filter(lambda x:x[0]=="北京")
#对北京的商品进行去重
items_distinct_beijin=items_beijin.map(lambda x:x[1]).distinct()
#北京所卖的商品类别有
print(f"北京所卖的商品类别有{items_distinct_beijin.collect()}")

#美国数据处理
import json
#打开要处理的数据文件
f=open("D:/学习资料/python/课件/课件/资料/资料/可视化案例数据/折线图数据/美国.txt","r",encoding="UTF-8")
us_data=f.read()
print(us_data)
# 把不符合 json 数据格式的 "jsonp_1629344292311_69436(" 去掉
data = us_data.replace("jsonp_1629344292311_69436(","")
# 把不符合 json 数据格式的 ");" 去掉
data = data[:-2]
# 数据格式符合 json 格式后，对数据进行转化为 python 数据格式
data = json.loads(data)
# 获取美国的疫情数据
pydata = data["data"][0]["trend"]
# 获取 2020 年的数据
x1_data = pydata["updateDate"][45:314]
# 获取 2020 年的数据
y1_data = pydata["list"][0]["data"][45:314]
---------------------------------------------
#日本数据处理
import json
#打开要处理的数据文件
f=open("D:/学习资料/python/课件/课件/资料/资料/可视化案例数据/折线图数据/日本.txt","r",encoding="UTF-8")
jp_data=f.read()
print(jp_data)
# 把不符合 json 数据格式的 "jsonp_1629350871167_29498(" 去掉
data = jp_data.replace("jsonp_1629350871167_29498(","")
# 把不符合 json 数据格式的 ");" 去掉
data = data[:-2]
# 数据格式符合 json 格式后，对数据进行转化
data=json.loads(data)
# 获取美国的疫情数据
pydata=data["data"][0]["trend"]
# 获取 2020 年的数据
x1_data =pydata["updateDate"][46:314]
# 获取 2020 年的数据
y1_data = pydata["list"][0]["data"][46:314]
-----------------------------------------------
#印度数据处理
import json
#打开要处理的数据文件
f=open("D:/学习资料/python/课件/课件/资料/资料/可视化案例数据/折线图数据/印度.txt","r",encoding="UTF-8")
in_data=f.read()
print(in_data)
# 把不符合 json 数据格式的 "jsonp_1629350871167_29498(" 去掉
data = in_data.replace("jsonp_1629350871167_29498(","")
# 把不符合 json 数据格式的 ");" 去掉
data = data[:-2]
# 数据格式符合 json 格式后，对数据进行转化
data = json.loads(data)
# 获取美国的疫情数据
pydata = data["data"][0]["trend"]
# 获取 2020 年的数据
x1_data = pydata["updateDate"][:269]
# 获取 2020 年的数据
y1_data = pydata["list"][0]["data"][:269]
----------------------------------------------
#全球折线图生成
#导入折线图模块
from pyecharts.charts import Line
#导入全局配置选项模块
import pyecharts.options as opts
#导入 json
import json
#导入处理后的数据
import 美国数据处理 as us_data
import 日本数据处理 as jp_data
import 印度数据处理 as id_data
#创建折线图
l=Line(init_opts=opts.InitOpts(width="1600px",height="800px"))
#图表全局设置
l.set_global_opts(
	# 设置图标题和位置
	title_opts=opts.TitleOpts(title="全球 2020 年确诊人数",pos_left="center"),
	# x 轴配置项
	xaxis_opts=opts.AxisOpts(name="时间"),    # 轴标题
	# y 轴配置项
	yaxis_opts=opts.AxisOpts(name="累计确诊人数"),    # 轴标题
	# 图例配置项
	legend_opts=opts.LegendOpts(pos_left='70%'),    # 图例的位置
)

#添加数据

l.add_xaxis(xaxis_data=us_data.x1_data)

l.add_yaxis(y_axis=us_data.y1_data,series_name="美国 2020 确诊人数",label_opts=opts.LabelOpts(is_show=False))
l.add_yaxis(y_axis=jp_data.y1_data,series_name="日本 2020 确诊人数",label_opts=opts.LabelOpts(is_show=False))
l.add_yaxis(y_axis=id_data.y1_data,series_name="印度 2020 确诊人数",label_opts=opts.LabelOpts(is_show=False))
#生成图表
l.render("全球疫情折现图.html")

#国内疫情地图数据处理文件
import json
#读取文件
f=open("D:\学习资料\python\课件\课件\资料\资料\可视化案例数据\地图数据\疫情.txt","r",encoding="UTF-8")
data=f.read()
#将 json 数据转换为 python 数据格式
data=json.loads(data)
pydata=data["areaTree"][0]["children"]
location=list()
for dict in pydata:
    if dict["name"]=="北京"or dict["name"]=="上海"or dict["name"]=="天津"or dict["name"]=="重庆":
        location.append((dict["name"]+"市",dict["total"]["confirm"]))
    elif dict["name"]=="香港"or dict["name"]=="澳门":
        location.append((dict["name"] + "特别行政区", dict["total"]["confirm"]))
    elif dict["name"]=="内蒙古"or dict["name"]=="西藏":
        location.append((dict["name"]+"自治区",dict["total"]["confirm"]))
    elif dict["name"]=="广西":
        location.append((dict["name"]+"壮族自治区",dict["total"]["confirm"]))
    elif dict["name"]=="宁夏":
        location.append((dict["name"] + "回族自治区", dict["total"]["confirm"]))
    elif dict["name"]=="新疆":
        location.append((dict["name"] + "维吾尔自治区", dict["total"]["confirm"]))
    else:
        location.append((dict["name"]+"省",dict["total"]["confirm"]))
#测试
if __name__=='__main__':
    print(location)
_________________________________________________
#生成地图文件
#导入第三方包
from pyecharts.charts import Map
from pyecharts.options import VisualMapOpts
#导入处理后的数据
import 国内疫情地图数据处理 as china_data
#创建地图对象
map=Map()
#添加数据
map.add("国内疫情地图",china_data.location,"china")
map.set_global_opts(
    visualmap_opts=VisualMapOpts(
        is_show=True,
        is_piecewise=True,
        pieces=[
            {"min":1,"max":9,"label":"1-9","color":"#CCFFFF"},
            {"min":10,"max":99,"label":"10-99","color":"#FFFF99"},
            {"min":99,"max":499,"label":"99-499","color":"#FF9966"},
            {"min":500,"max":999,"label":"500-999","color":"#FF6666"},
            {"min":1000,"max":9999,"label":"1000-9999","color":"#CC3333"},
            {"min":9999,"label":"1000 以上","color":"#990033"}
        ]
    )
)
#生成地图
map.render("国内疫情地图.html")

#湖北省疫情数据处理文件
#导入 json
import json
#读取数据文件
f=open("D:\学习资料\python\课件\课件\资料\资料\可视化案例数据\地图数据\疫情.txt","r",encoding="UTF-8")
#数据处理
data=f.read()
data=json.loads(data)
pydata=data["areaTree"][0]["children"][6]["children"]
location=list()
for dict in pydata:
    if dict["name"]=="神农架":
        location.append((dict["name"]+"林区", dict["total"]["confirm"]))
    elif dict["name"]=="恩施州":
        location.append((dict["name"][:2]+"土家族苗族自治区", dict["total"]["confirm"]))
    else:
        location.append((dict["name"]+"市",dict["total"]["confirm"]))
#测试
if __name__=='__main__':
    print(location)
________________________________________________
#生成地图文件
#导入第三方包
from pyecharts.charts import Map
from pyecharts.options import VisualMapOpts
#导入处理后的数据
import 省内疫情地图数据处理 as data
#新建地图对象
map=Map()
#添加数据
map.add("湖北省疫情地图",data.location,"湖北")
#设置视觉映射器
map.set_global_opts(
    visualmap_opts=VisualMapOpts(
        is_show=True,  # 表示展示数据的标注值是否显示在色块上面，如果该值为 True，标注值将被绘制出来。
        is_piecewise=True,  # 表示数据是否需要分段区分（例如分段颜色显示），如果该值为 True，则绘制类似于深浅不同的颜色块表示数据的分段程度，如果该值为 False，则表示将具体值用具体颜色表示。
        pieces=[
            {"min": 1, "max": 9, "label": "1-9", "color": "#CCFFFF"},  # 颜色分区
            {"min": 10, "max": 99, "label": "10-99", "color": "#FFFF99"},
            {"min": 99, "max": 499, "label": "99-499", "color": "#FF9966"},
            {"min": 500, "max": 999, "label": "500-999", "color": "#FF6666"},
            {"min": 1000, "max": 9999, "label": "1000-9999", "color": "#CC3333"},
            {"min":9999,"label":"1000 以上","color":"#990033"}
        ]
    )
)
#生成地图
map.render("湖北省疫情地图.html")

#动态柱状图的数据处理文件
#导入 json
import json
#读取文件
f=open("D:/学习资料/python/课件/课件/资料/资料/动态柱状图数据/1960-2019 全球 GDP 数据.csv","r",encoding="GB2312")
data=f.readlines()
#处理数据
#删除首行元素
data.pop(0)
#以逗号划分
#构建嵌套字典{年份：[（国家：GDP）]}
dict=dict()
for str in data:
    year=int(str.split(",")[0])
    country=str.split(",")[1]
    GDP=float(str.split(",")[2])
    try:
        dict[year].append([country,GDP])
    except:
        dict[year]=[]
        dict[year].append([country,GDP])
#每一年
year=dict.keys()
# year=sorted(year)
print(year)
#排序每一年的 GDP 前八个国家
def choose_key(element):
    return element[1]
for i in year:
    dict[i].sort(key=choose_key,reverse=True)
————————————————————————————————————————————————
#动态柱状图的生成
#导入相关包
from pyecharts.charts import Bar,Timeline
from pyecharts.options import *
#导入处理好的数据
import GDP 动态柱状图数据处理 as data
#新建一个时间线
line=Timeline()
#新建柱状图
for i in data.year:
    countrys=[]
    gdps=[]
    #取出 GDP 前八的国家
    pydata=data.dict[i][0:8]
    #准别 xy 轴额数据
    for country_gdp in pydata:
        countrys.append(country_gdp[0])
        gdps.append(country_gdp[1]/100000000)
    bar=Bar()
    #反转数据，大的数据在上，小的在下
    countrys.reverse()
    gdps.reverse()
    #设置标题
    bar.set_global_opts(title_opts=TitleOpts(title=f"{i}年全球前八国家"))
    #添加 xy 轴数据
    bar.add_yaxis("GDP(亿)",gdps,label_opts=LabelOpts(position="right"))
    bar.add_xaxis(countrys)
    #反转 xy 轴
    bar.reversal_axis()
    line.add(bar,str(i))
#设置自动播放
line.add_schema(
    play_interval=1000, #自动播放时间间隔
    is_timeline_show=True, #是否在播放的时候显示时间线
    is_auto_play=True, #是否自动播放
    is_loop_play=True  #是否循环播放
)
#生成柱状图
line.render("GDP 动态柱状图.html")

Python 基础语法、数据结构与核心编程指南

Python 基础语法

PyCharm 常用快捷键

Python 基础语法

一、注释

二、变量与 print 输出函数

三、数据类型

四、数据类型转换

五、标识符

六、运算符

七、字符串

字符串定义方法三种

字符串的拼接：

格式化精度控制

数据输入函数 input()

八、判断语句

一、布尔类型与比较运算符

二、if 语句

九、循环语句

1.while 循环语句

2.while 循环的嵌套

3.for 循环

4.变量的作用域

5.for 循环的嵌套使用

6.break 与 continue 关键字

十、函数

1.函数的定义：

2.函数的参数

3.函数的返回值

4.函数说明文档

5.函数的嵌套使用

6.变量的作用域

十一、数据容器

1.list 列表

2.tuple(元组)

3.字符串

4.数据容器 (序列) 的切片

5.set(集合)

6.字典

7.各个数据容器之间的对比

8.各个数据容器之间的通用操作

十二、函数进阶

1，多个返回值的函数

2，函数的多种传参方式

3.匿名函数

十三、文件操作

1.文件编码

2.打开文件

3.读文件

4.文件的写入

十四、异常，模块，包

1.异常

2.异常的捕获方法

3.异常的传递

4.模块

5.包

十五、面向对象

1.初始对象

2.类的定义

3.类和对象

4.构造方法

5.其它内置方法

6.封装的概念

7.继承

8.复写父类方法

9.类型注解

10.多态

十六、高阶技巧

1.闭包

2.装饰器

3.单例模式

4.工厂模式

5.多线程

6.网络编程

7.正则表达式

8.递归

十七、pymysql 基础

1.DDL

2.DML

3.DQL