Giới thiệu về Khoa học dữ liệu trong Python bài tập 1 Patterns Coursera University of Michigan

Đối với bài tập này, bạn sẽ xem dữ liệu năm 2017 về tiêm chủng từ CDC. Tệp dữ liệu của bạn cho nhiệm vụ này nằm trong nội dung/NISPUF17. csv. Hướng dẫn dành cho người dùng dữ liệu về vấn đề này, bạn sẽ cần ánh xạ các biến trong dữ liệu với các câu hỏi đang được hỏi, có sẵn tại tài sản/NIS-PUF17-DUG. pdf. Ghi chú. bạn có thể phải truy cập cây Jupyter của mình [nhấp vào hình ảnh Coursera] và điều hướng đến thư mục tài sản của bài tập 2 để xem tệp PDF này]

Câu hỏi 1

Write a function called

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
2 which returns the proportion of children in the dataset who had a mother with the education levels equal to less than high school [12] and college degree.

Hàm này sẽ trả về một từ điển ở dạng [sử dụng số chính xác, không làm tròn số]

1
2
3
4
{"less than high school":0.2,
"high school":0.4,
"more than high school but not college":0.2,
"college":0.2}

Mã số

_______ 4 ____ 5 ____ 6

结果



Câu hỏi 2

Hãy cùng khám phá mối quan hệ giữa việc cho con bú sữa mẹ khi còn nhỏ và việc tiêm vắc-xin cúm theo mùa từ nhà cung cấp dịch vụ chăm sóc sức khỏe. Trả về một bộ số lượng vắc-xin cúm trung bình cho những đứa trẻ mà chúng tôi biết đã nhận được sữa mẹ khi còn nhỏ và những đứa trẻ không biết

Hàm này sẽ trả về một bộ ở dạng [sử dụng các số chính xác

1
[2.5, 0.1]

Mã số

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
1
2
3
4
0
1
{"less than high school":0.2,
"high school":0.4,
"more than high school but not college":0.2,
"college":0.2}
1

结果


## Câu hỏi 3 Sẽ rất thú vị nếu có bất kỳ bằng chứng nào về mối liên hệ giữa hiệu quả của vắc xin và giới tính của trẻ. Tính tỉ số giữa số trẻ em mắc bệnh thủy đậu nhưng đã được tiêm phòng [ít nhất một liều thủy đậu] so với số trẻ đã được tiêm phòng nhưng không mắc bệnh thủy đậu. Trả kết quả theo giới tính

Hàm này sẽ trả về một từ điển ở dạng [sử dụng các số chính xác]

{"less than high school":0.2,
"high school":0.4,
"more than high school but not college":0.2,
"college":0.2}
2____23

Ghi chú. Để hỗ trợ xác minh, giá trị

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
3 mà trình tự động chấm điểm đang tìm kiếm bắt đầu bằng các chữ số
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
4

Mã số

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
{"less than high school":0.2,
"high school":0.4,
"more than high school but not college":0.2,
"college":0.2}
5
1
{"less than high school":0.2,
"high school":0.4,
"more than high school but not college":0.2,
"college":0.2}
7

结果



câu hỏi 4

Một tương quan là một mối quan hệ thống kê giữa hai biến. Nếu chúng ta muốn biết liệu vắc-xin có hiệu quả hay không, chúng ta có thể xem xét mối tương quan giữa việc sử dụng vắc-xin và liệu nó có giúp ngăn ngừa nhiễm trùng hoặc bệnh tật hay không [1]. Trong câu hỏi này, bạn phải xem liệu có mối tương quan giữa việc bị thủy đậu và số liều vắc-xin thủy đậu đã tiêm [trái rạ]

Một số lưu ý khi diễn giải câu trả lời.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
5 là
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
6 [nếu có] hoặc
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
7 [không] và
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
8 là số liều trẻ đã được tiêm vắc xin thủy đậu. Một tương quan tích cực [e. g. ,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
9] có nghĩa là sự gia tăng của
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
5 [có nghĩa là nhiều số không hơn] cũng sẽ làm tăng các giá trị của
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
8 [có nghĩa là nhiều liều vắc-xin hơn]. Nếu có một mối tương quan tiêu cực [e. g. ,
def proportion_of_education[]:
# your code goes here
# YOUR CODE HERE
# raise NotImplementedError[]
import pandas as pd
import numpy as np
df = pd.read_csv["assests/NISPUF17.csv", index_col=0]
EDUS=df['EDUC1']
edus=np.sort[EDUS.values]
poe={"less than high school":0,
"high school":0,
"more than high school but not college":0,
"college":0}
n=len[edus]
poe["less than high school"]=np.sum[edus==1]/n
poe["high school"]=np.sum[edus==2]/n
poe["more than high school but not college"]=np.sum[edus==3]/n
poe["college"]=np.sum[edus==4]/n
return poe
2], nó chỉ ra rằng việc mắc bệnh thủy đậu có liên quan đến việc tăng số lượng liều vắc-xin

Ngoài ra,

def proportion_of_education[]:
# your code goes here
# YOUR CODE HERE
# raise NotImplementedError[]
import pandas as pd
import numpy as np
df = pd.read_csv["assests/NISPUF17.csv", index_col=0]
EDUS=df['EDUC1']
edus=np.sort[EDUS.values]
poe={"less than high school":0,
"high school":0,
"more than high school but not college":0,
"college":0}
n=len[edus]
poe["less than high school"]=np.sum[edus==1]/n
poe["high school"]=np.sum[edus==2]/n
poe["more than high school but not college"]=np.sum[edus==3]/n
poe["college"]=np.sum[edus==4]/n
return poe
3 là xác suất mà chúng tôi quan sát thấy mối tương quan giữa
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
5 và
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
8 lớn hơn hoặc bằng một giá trị cụ thể ngẫu nhiên xảy ra. Một
def proportion_of_education[]:
# your code goes here
# YOUR CODE HERE
# raise NotImplementedError[]
import pandas as pd
import numpy as np
df = pd.read_csv["assests/NISPUF17.csv", index_col=0]
EDUS=df['EDUC1']
edus=np.sort[EDUS.values]
poe={"less than high school":0,
"high school":0,
"more than high school but not college":0,
"college":0}
n=len[edus]
poe["less than high school"]=np.sum[edus==1]/n
poe["high school"]=np.sum[edus==2]/n
poe["more than high school but not college"]=np.sum[edus==3]/n
poe["college"]=np.sum[edus==4]/n
return poe
3 nhỏ có nghĩa là mối tương quan quan sát được rất khó xảy ra tình cờ. Trong trường hợp này,
def proportion_of_education[]:
# your code goes here
# YOUR CODE HERE
# raise NotImplementedError[]
import pandas as pd
import numpy as np
df = pd.read_csv["assests/NISPUF17.csv", index_col=0]
EDUS=df['EDUC1']
edus=np.sort[EDUS.values]
poe={"less than high school":0,
"high school":0,
"more than high school but not college":0,
"college":0}
n=len[edus]
poe["less than high school"]=np.sum[edus==1]/n
poe["high school"]=np.sum[edus==2]/n
poe["more than high school but not college"]=np.sum[edus==3]/n
poe["college"]=np.sum[edus==4]/n
return poe
3 phải rất nhỏ [sẽ kết thúc bằng
def proportion_of_education[]:
# your code goes here
# YOUR CODE HERE
# raise NotImplementedError[]
import pandas as pd
import numpy as np
df = pd.read_csv["assests/NISPUF17.csv", index_col=0]
EDUS=df['EDUC1']
edus=np.sort[EDUS.values]
poe={"less than high school":0,
"high school":0,
"more than high school but not college":0,
"college":0}
n=len[edus]
poe["less than high school"]=np.sum[edus==1]/n
poe["high school"]=np.sum[edus==2]/n
poe["more than high school but not college"]=np.sum[edus==3]/n
poe["college"]=np.sum[edus==4]/n
return poe
8 biểu thị một số rất nhỏ]

[1] Đây không thực sự là bức tranh đầy đủ, vì chúng tôi không xem xét liều lượng được đưa ra khi nào. Có thể trẻ bị thủy đậu rồi bố mẹ đưa đi tiêm. Tập dữ liệu này có dữ liệu mà chúng tôi cần để điều tra thời điểm dùng liều không?

Chủ Đề