統計的陷阱The Pitfalls of Statistics
Responsive image
老師: 鄭少為
基本資訊
課程代碼
10920STAT631100
課程名稱
統計的陷阱The Pitfalls of Statistics
學分
3
學期
1092
單位
統計所 (STAT)
班級
碩士班
修課人數
8 人
老師
課程說明
課程簡介
一、課程介紹:
統計是探討如何由數據中挖掘資訊的一門學問。但在統計的應用上,常會見到有意或無意地誤用統計方法,以致於對數據內所包含的資訊,造成錯誤的印象或解讀的情況。這種誤用即為應用統計方法時的陷阱。有一句著名的西方諺語:There are three kinds of lie: lies, damned lies, and statistics,便是因此而起。若是不了解各種統計的陷阱,一方面極易在執行數據分析時不慎便落入陷阱,得到不夠嚴謹或錯誤的分析結論。另一方面,一個好的數據科學家,也應具備發現他人的數據分析結論中所存在的可能陷阱之能力。在這門課中,我們將透過閱讀相關書籍分組口頭報告課堂討論陷阱攻防戰的方式,來了解各種統計陷阱。透過這門課,學生除了可了解各種統計分析方法中的陷阱,並能得到辨識數據分析結果中的統計陷阱之能力。
 
本課程的上課時間為:Tuesday 2:20-3:10PM and Thursday 10:10AM-12:00PM,調課時間為:Tuesday 3:30-4:20PM
 
二、課程網站
本課程的網站(https://lms.nthu.edu.tw/course/51449)位於清大的iLMS系統內,其中常用的連結如下:
  • 課程說明:放置課程大綱和每次陷阱攻防戰的分組資訊。
  • 課程行事曆:定期公告每周上課的練習內容,以及與分組口頭報告相關的注意事項。
  • 上課教材:放置與課程相關之檔案。
  • 課程活動(公告):放置每周的課後通知、課程公告或活動公告。
  • 作業:供上傳分組口頭報告的投影片或分析相關檔案。
 
三、教科書與參考書:
無指定教科書。參考書(references)為:
  1. Statistics Done Wrong: The Woefully Complete Guide, written by Alex Reinhart (2015) [中譯本:不敗的數據學, 臉譜出版社]
  2. Standard Deviation, written by Gary Smith (2014) [中譯本: 常識統計學, 日出出版社]
  3. Weaponized Lies: How to Think Critically in the Post-Truth Era, written by Daniel J. Levitin (2016) [中譯本:一眼就突破盲點的思考力, 商周出版社]
  4. How to Lie with Statistics, written by Darrell Huff and Irving Geis (1954) [中譯本: 別讓統計數字騙了你, 天下文化]
  5. Damned Lies and Statistics: Untangling Numbers from the Media, Politicians, and Activists, written by Joel Best (2012) [中譯本: 統計數字是事實還是謊言, 商周出版社]
  6. How to Lie with Charts, 4th ed., written by Gerald Everett Jones (2018) [中譯本: 別讓統計圖表唬弄你, 天下文化]
  7. The 9 Pitfalls of Data Science, written by Gary Smith and Jay Cordes (2019)
  8. Avoiding Data Pitfalls, written by Ben Jones (2020)
  9. Common Errors in Statistics (and How to Avoid Them), 4th ed., written by Philip I. Good and James W. Hardin (2012)
 
四、陷阱攻防戰規則
  • 在每次的陷阱攻防戰中,修課學生會隨機分成兩隊比賽。比賽會透過以下五個階段來進行:1. 閱讀報告期、2. 陷阱製造期、3. 陷阱破解期、4.攻防結果討論期、5.遺珠陷阱討論期。
  • 1.閱讀報告期:
    • 每位同學都需在上課前,閱讀完老師所指定的章節內容
    • 上課時,修課同學隨機分成兩隊,討論所有的指定章節內容。並當場做出投影片,上台做口頭報告
    • 在口頭報告時,可兩隊彼此協調分攤,每隊僅報告閱讀內容其中一部分。
    • 口頭報告的內容,以章節中所呈現的各種統計陷阱為主。
    • 預定時間長度:2堂課。
  • 2.陷阱製造期-課堂討論:
    • 上課時,修課同學再次隨機分成兩隊。每一隊各自在課堂內,討論如何使用資料做統計分析,製造所閱讀之章節內所提及的統計陷阱。
    • 在課堂討論之前,每位同學應先自行想好1~2個陷阱題,再帶到課堂內討論,以加速討論進度。
    • 所使用的資料可為真實數據,經人為操弄後的真實數據(為了練習需要,操弄的真實數據不算是統計陷阱),或是模擬數據。分析可使用一筆數據,或多筆不同的數據。
    • 預定時間長度:2堂課。
  • 2.陷阱製造期-口頭報告:
    • 於課堂上口頭報告,呈現5個題目(分析結果)。5個題目的內容,皆需與本次的閱讀內容相關。5題中,須有2題包含陷阱(錯誤或有缺陷的分析結果),其餘3題則為正確結果。
    • 陷阱題與正確題之內容,都需與本次所閱讀的章節相關。
    • 題目敍述中,必需明確包含以下三部分:情境、分析、結論。陷阱可放置於"分析"或"結論"中,但禁止放置於"情境"中。若題目敍述中包含資料收集方式的陳述,該陳述可放置於"情境"或"分析"中。
    • 在口頭報告時,每個題目都需提供足夠証據力的分析結果,以支持該題目的結論。
    • 2個陷阱需為不同的統計陷阱。
    • 口頭報告時,可對敵隊的題目詢問問題。但問題應僅限於了解敵隊題目之陳述內容為限。若敵隊覺得所詢問之問題超出了解陳述內容之範疇,可拒絕回答。
    • 口頭報告後,每隊皆需將5個題目中何者為陷阱題(包括為何其為陷阱題的解釋),何者為正確題的答案,以加密之壓縮檔,於口頭報告該日晚上11:00之前,上傳至作業區。
    • 預定時間長度:1堂課。
  • 3.陷阱破解期-課堂討論:
    • 陷阱破解期的課堂討論,將緊接在陷阱製造期的口頭報告後,於課堂上進行。討論內容為將對敵隊提出的問題與分析之要求。
    • 對於敵隊所呈現的5個題目,最多可以提出6個問題或分析,要求對方回答或執行分析。
    • 6個問題或分析的要求,需於陷阱製造期口頭報告完成後隔天中午12:00前,上傳到作業區,以供敵隊檢視。
    • 問題或分析要求的陳述需明確。每個問題或分析只能針對一個敵隊題目提出。
    • 預定時間長度:1堂課。
  • 3.陷阱破解期-口頭報告:
    • 對敵隊所提的要求之回覆,兩隊皆於課堂上以口頭報告的方式呈現。
    • 若覺得敵隊的回覆未達要求,可在敵隊口頭報告時提出異議。若異議經老師同意,敵隊需當場提出能令人滿意的回覆。
    • 口頭報告結束後,該堂課的剩餘時間,供每隊討論答案之用。
    • 預定時間長度:1堂課。
  • 4.攻防結果討論期:
    • 兩隊在各自聽完敵隊的回覆後,在一天內提出答案,指出敵隊的那2個題目包含陷阱,以及為何認定其為陷阱的理由。答案理由需於聽完敵隊回覆後隔天中午12:00前,上傳至作業區,供敵隊評分。同時亦請上傳加密解答檔的密碼。
    • 每一隊評分敵隊的結果,在課堂上以口頭報告的方式呈現。
    • 若對評分的結果有異議,可在課堂上提出。異議是否有效的最終判定者為授課老師。
    • 預定時間長度:1堂課。
  • 5.遺珠陷阱討論期:
    • 經調查,若至少有3個遺珠陷阱可供討論,則將開啟此副本。
    • 副本進行時,希望呈現遺珠陷阱的同學,可於課堂上提供遺珠陷阱,供大家討論。
    • 提供遺珠陷阱的同學,可獲得額外分數(最多10%)。
    • 預定時間長度:1堂課。
  • 攻防結果評分原則
    1. 每一隊在攻防戰開始之前,各自擁有10分,每個題目各2分。
    2. 每隊的5個題目,何者正確何者為陷阱,以之前上傳的加密壓縮檔中的答案為準。
    3. 若某個陷阱題被敵隊攻破,且敵隊提供的理由正確,則該陷阱題的2分歸敵隊。
    4. 若某個陷阱題被敵隊攻破,但敵隊提供的理由錯誤,則該陷阱題的2分中,1分歸敵隊。
    5. 若某個正確題被敵隊指出,此題包含錯誤或陷阱,或是某個陷阱題被敵隊指出,此陷阱題事實上是正確的。經老師認可後,該正確題(或陷阱題)的2分歸敵隊,且需再由某敵隊未指出的陷阱題(或正確題)的2分中,取1分歸敵隊。
    6. 若覺得敵隊5個題目中陷阱(或錯誤)題多於2個,除之前提出的2個答案之外,其餘覺得有爭議之題目,亦可於結果評分時提出討論。惟後者不再列入計分。
    7. 經以上原則判定完成後的分數,即為每隊在該次攻防戰中的得分。
  • 隨著課程進行,將會視需要修改規則,以使其更符合學習需要。
 
五、學期總成績的評分方式:課堂討論個人貢獻(10%)、分組口頭報告(30%)、陷阱攻防戰(60%)、遺珠陷阱報告(額外10%)
 
六、分組資訊
  1. 第一次陷阱攻防戰 (閱讀章節:Reference 1, Chapters 1~3)
    組別 組員
    1 劉必翔、廖芳翊、邱荷晴、江伯耕
    2 黃靖雯、劉怡禎、黃信蓁、劉軒成
  2. 第二次陷阱攻防戰 (閱讀章節:Reference 1, Chapters 4, 5, 6, 7)
    組別 組員
    1 江伯耕、黃信蓁、劉怡禎、邱荷晴
    2 劉軒成、廖芳翊、黃靖雯、劉必翔
  3. 第三次陷阱攻防戰 (閱讀章節:Reference 1, Chapters 8, 9, 10, 11)
    組別 組員
    1 劉軒成、廖芳翊、劉怡禎、邱荷晴
    2 劉必翔、黃靖雯、江伯耕、黃信蓁
  4. 第四次陷阱攻防戰 (閱讀章節:Reference 2, Chapters 1, 2, 3, 4, 8, 10)
    組別 組員
    1 邱荷晴、黃靖雯、劉怡禎、江伯耕
    2 廖芳翊、劉軒成、劉必翔、黃信蓁
  5. 第五次陷阱攻防戰 (閱讀章節:Reference 2, Chapters 11, 12, 13, 14, 15, 16, 17, 18)
    組別 組員
    1 廖芳翊、黃靖雯、劉軒成、邱荷晴
    2 黃信蓁、江伯耕、劉必翔、劉怡禎
  6. 第六次陷阱攻防戰-限時戰 (閱讀章節:Reference 2, Chapter 5; Reference 3, Chapters 1, 2, 3, 4, 5, Reference 5, Chapter 3)
    組別 組員
    1 邱荷晴、黃信蓁
    2 劉怡禎、黃靖雯
    3 劉軒成、江伯耕
    4 劉必翔、廖芳翊
 
七、其它注意事項
  • 口頭報告時,應準備清楚合宜之投影片以解釋報告內容。報告投影片必須於報告前一天晚上11:00之前,上傳至課程網站的“作業”中。
  • 每組口頭報告時,最好至少準備兩台筆電。一台負責投影片報告,另一台則可隨時應要求,做數據分析並呈現分析結果。所有筆電都應於上課前,連結到無線投影PC上 (如何連結請見此網頁AirServer,教室PC已安裝AirServer),以便筆電螢幕可以隨時投影呈現於課堂上。另外,建議同學們上課時可自行準備電射筆,以方便討論。
  • 在每次的陷阱攻防戰結束前,兩隊中的每一個成員皆須至少上台口頭報告2次
  • 兩次相鄰的陷阱攻防戰,在進行時間上,可能會有所重疊。
  • 教室課桌椅安排:每次上課前,請同學們將課桌椅擺放成ㄇ字型或回字型,以利討論。
 
八、 聯絡方式及office hour
  • 授課老師
    • 辦公室:綜合三館 room 818 (分機:33162).
    • office hour:Monday, 4~5 PM.
    • e-mail address:swcheng@stat.nthu.edu.tw.
  • 助教:廖怡華
    • office hour 時間:禮拜三下午13:20-14:10
    • office hour 地點:綜合三館 Room 820
    • email address:lisa22910203@yahoo.com.tw
九、 限時戰攻防規則
  • 兩人一組,隨機分組進行限時戰。
  • 限時戰會透過以下三個階段來進行:1. 閱讀報告期、2. 陷阱製造期、3. 攻防問答期。
  • 1. 閱讀報告期: 每組分配並報告不同的閱讀內容。
  • 2. 陷阱製造期: 每組選取該組閱讀內容中的某個陷阱,來製造一個陷阱題。
  • 3. 攻防問答期: 每組輪流擔任防守方。防守方需在30分鐘內,防守自己的陷阱題。防守方要先報告該組的陷阱題,報告時間不可超過5分鐘。剩餘時間則由其他組(攻擊方)的同學依序輪流選擇(a)詢問一個問題, (b)破解陷阱, 或(c)pass。攻擊方發問次數無限制,防守組需回答攻擊組所提出的問題。攻擊方需在30分鐘內,破解該陷阱題中的陷阱,否則即算失敗。
  • 計分方式: 每組擔任防守方時,有6分(同組兩人,每人3分)。若攻擊方在30分鐘內破解陷阱,則防守方的6分歸給攻擊方(攻擊方6人,每人得1分)。若防守成功,防守方可保有該6分。
  • 每組上傳iLMS的陷阱題投影片,在攻防問答期進行之前,不會公開。
 
 
QR Code
放大