Home
學生控制台
註冊會員/登入
研究知情同意書
支援與訊息
Uptime 數據

UeduGPTs

--

Jupyters

16

清華大學 AQI 28 28°C PM2.5 8

AI 回覆桌面通知

AI 助教回覆完成時顯示桌面通知

聊天訊息通知

同學在討論區發送訊息時通知

聲音通知

每當有新通知時播放提示音

數位學習研究小聚 · 2026 年 5 月場

Environomics:把學校空污與氣象資料接進課程分析

當學習研究跨出 LMS,下一步該去哪裡蒐集資料?我們從教室外的空氣與氣候開始。

時間
5 月 20 日(週三)11:00 – 11:50
線上舉行 · 本月時間提前一小時
事前閱讀
讀完本頁再進場,可直接切入第二輪互動討論
現場同步
當天進入線上會議室,跟著議程一起討論
事後延伸
當天有事的老師可事後翻閱本頁,並透過頁尾任一管道延伸合作
關於這份頁面: 本頁同時做為小聚的「事前讀物」、「現場簡報」與「事後延伸資料」。如果您 5/20 當天有會議或上課無法參加,本頁可獨立閱讀;如果您讀完想進一步討論,頁尾有三條接觸管道,歡迎隨時來信,不限定當天。

1. 為什麼要把環境資料納入學習研究?

傳統學習分析(Learning Analytics)大多以 LMS 點擊紀錄、作業繳交、測驗成績為主要資料。然而學習從來不是發生在真空中——學生上課時所處的空氣品質、教室溫度、午後雷雨後的相對濕度,都可能默默地影響其專注度與認知負荷。當我們只看 LMS 內的資料,等於只測量學習「結果」,而忽略了學習「情境」。

Educational Omics 六維度框架

Uedu 提出 Educational Omics(教育組學)框架,將學習研究的資料維度擴展為六個彼此互補的「組學」面向。Environomics(環境組學)是其中一維,負責回答「學習者所處的物理環境是什麼樣子」這個問題。

Cognomics
認知歷程:LLM 對話、Bloom 認知層次
Linguomics
語言表達:語意分析、語音轉文字
PhysioNeuromics
生理神經:HRV、睡眠、壓力、EEG
Sociomics
社會互動:討論區、協作學習
Environomics
學習環境:光照、溫濕度、空氣品質
← 本次小聚主題
Ethicomics
倫理規範:同意、隱私、偏誤檢測
我們今天追問什麼問題? 不是「環境一定影響學習」(這需要實證),而是「如果環境影響學習,我們的研究基礎建設準備好了嗎?能不能把這個變數以可靠的方式接進來?」今天聚焦在「資料工程的能力建置」,研究結論留給後續的論文。

2. 資料規模:我們目前接進來的全貌

Uedu Environomics 整合台灣兩大官方環境資料源——中央氣象署 (CWA) 與環境部 (MoEnv)。下列數字是「能力指標」,不是研究結論,請放心對外引用。

1,215
CWA 自動氣象站
853 + 362 站
84
MoEnv 空品測站
全台分布
24
空品變數種類
PM2.5/PM10/O3/碳氫…
5
年歷史回填
2022 起,約 250 萬列
資料源結構
來源 資料集 站數 特色 更新頻率
CWA O-A0001-001 853 自動氣象站:溫度、濕度、降雨、風 每小時
CWA O-A0003-001 362 局屬站:額外含 UV、日照、能見度 每小時
MoEnv aqx_p_432 84 即時 AQI、PM2.5、O3 等污染物 每小時
MoEnv aqx_p_15 ~90 5 年歷史 + 碳氫、空品站氣象變數 每日清晨補上昨日
未來規劃:補足「戶外資料無法觸及的解析度」
戶外環境資料的覆蓋密度由 CWA + MoEnv 處理已足夠,再加民間微型感測器仍只是「戶外」的更高密度。下一步的核心挑戰是教室內微環境——學生實際暴露的空氣、光照、CO₂、噪音,與戶外差距可能很大。
Uedu 正自建STDB.org(智慧物件資料管理與分析平台),整合自製 IoT 感測裝置,預計納入教室層級即時資料,做為 Uedu 端到端 Environomics 基礎建設的原創貢獻。

3. 三個關鍵資料工程設計

多源環境資料接進來看似簡單,實際上有三個非平凡的工程問題。下面分享我們的方法,這些是可重複使用的 pattern,希望對其他研究團隊有幫助。

3.1 時間對齊:所有觀測一律存 UTC

CWA 的時間欄位是 ISO 8601 含 +08:00 時區(如 2026-05-15T14:00:00+08:00),MoEnv 則是裸的台灣本地時間字串(如 2026/05/15 14:00:00)。如果直接照寫進 DB,跨來源比對就會錯一小時。

我們的做法: 在 ETL 端統一轉為 UTC naive DATETIME 進庫;前端要顯示給台灣使用者時,再轉回 +08:00。這遵循「DB 統一存 UTC、顯示端做時區轉換」的全平台原則。

關鍵函式: parse_cwa_iso_to_utc() / parse_moenv_to_utc()
3.2 空間對齊:學校 → 最近 K 站的 IDW 加權

學校與測站不會剛好同地點。例如中央大學在桃園市中壢區,最近的 MoEnv 站是平鎮 (~2 km) 與中壢 (~3 km)。如果直接取整個桃園市 6 站的平均,反而會被龜山、觀音、大園稀釋。

我們的做法: Haversine 公式計算球面距離 → 取最近 K 站(預設 K=3)→ Inverse Distance Weighting (p=2) 加權。距離越近權重越高,且不會被遠站稀釋。每個資料源(CWA / MoEnv)獨立做,因為兩者測站分布完全不同。

關鍵腳本: compute_environomics_school_station_map.py
3.3 Partial upsert:realtime 與 backfill 不互相覆蓋

MoEnv 即時資料集 (aqx_p_432) 含 AQI 但不含氣象變數,歷史資料集 (aqx_p_15) 隔日才公布卻含完整氣象與碳氫類。同一個 (站, 時) 的 row 會被兩條管線寫到。傳統 upsert 會用後者整列覆蓋前者,AQI 就被洗掉。

我們的做法: 改寫 upsert 只寫「本次有提供的欄位」,沒提供的欄位保留原值。Realtime 寫 AQI/PM2.5,backfill 寫 temp/RH/碳氫,互不衝突。實測 250 萬列 backfill 後 AQI 欄位仍保留 33 萬列,證明設計可靠。

關鍵函式: upsert_air_measurement_partial()
為什麼分享這些細節? 這三個 pattern 都不是 Environomics 專屬——任何要整合多源時序+空間資料的研究團隊都會碰到。我們把方法公開,希望其他學校與研究團隊可以直接參考,不需要重蹈我們踩過的工程地雷。

4. 三個入口的能力展示

資料接進來只是起點,真正的價值在於「使用者可以怎麼用」。我們設計了三個入口,分別對應不同的使用情境。當天會現場演示,以下提供連結讓您事前或事後自行探索。

入口 A:環境資料公開展示頁
給所有訪客看,無需登入

Leaflet 互動式測站地圖 + 四個 KPI 卡片,呈現時間涵蓋年數、總測站數、變數種類數、最新更新時間。讓訪客一眼看見 Uedu 在 Environomics 維度的資料規模。

開啟 /environment/
入口 B:ETL 管理後台
限管理員:監控資料新鮮度與 ETL 健康狀態

Freshness 色階(綠 / 黃 / 紅)標示最後成功時間、24 小時內失敗次數、各測站健康度。確保資料管線真的在跑,不會在會議當天才發現上週就斷掉了。

當天現場演示,會分享 screenshot
入口 C:ClassroomGPT 對話即時呼叫(重點展示)
學生在 AI 助教對話中問環境問題,秒答

這是 Uedu 把 Environomics 接進「使用者實際使用情境」的關鍵:學生不需要學會用 dashboard,只要在 AI 助教對話中自然提問,背後會自動呼叫對應的 function tool。三個層級的問題對應三個工具:

get_school_environment — 學校層級
使用者問:「我們學校今天的 AQI 怎麼樣?」
背後:以該校經緯度,對 IDW top-3 站做加權平均
get_county_environment — 縣市層級
使用者問:「桃園市這週的氣溫趨勢?」
背後:對該縣市所有測站做即時聚合,回傳時序
get_taiwan_environment_ranking — 全台排行
使用者問:「現在全台哪個縣市 PM2.5 最高?」
背後:跨縣市排序,支援 latest / 24h / 7d / 30d × asc / desc

5. 治理立場:政府開放資料「只用不再公開」

CWA 與 MoEnv 都已將資料對外開放,那 Uedu 為什麼不乾脆建一個鏡像站、做一個更好用的 API?這個選擇是刻意的,背後是研究倫理與責任分工的考量。

我們做的事
  • 視覺化展示給人類看(地圖、KPI、透明度說明)
  • 資料 server-side render 進 HTML,無 API endpoint
  • 引導使用者去原政府網站取原始資料
  • 將資料整合進 Uedu 自有研究與教學情境
我們不做的事
  • 不提供測站清單/地圖 JSON API
  • 不提供原始觀測資料下載
  • Uedu Lab 不開放 CWA / MoEnv 原始資料
  • 不做 KPI dashboard 對外即時展示具體數值
為什麼這樣切? 政府開放資料的權威性與更新時效由原機關負責,Uedu 二次發行只會增加版本不一致的風險,也會讓使用者不確定該信哪個源。我們的角色是「研究端的整合者」,不是「資料的再分發者」。未來若 Environomics 研究累積出衍生 insight(例如 PM2.5 × 認知表現的方法學成果),那會是 Uedu 的原創貢獻,可以開放;但底層原始資料始終回歸 CWA 與 MoEnv。

6. 進行中的研究問題(成果保留,歡迎合作)

關於分析結果: Uedu 團隊正以本資料管線進行多個學術論文撰寫中,依研究倫理與發表慣例,今天先不公開具體分析結果(如效應大小、相關係數、個別學校剖面)。本段列出我們正在追問的問題,邀請有興趣的研究夥伴進一步合作。
我們正在追問的問題(部分)
Q1. 環境變數 × 認知歷程

當 PM2.5 或氣溫處於不利區間時,學生在 AI 助教對話中展現的認知層次(Bloom)是否系統性地不同?這需要 Environomics 與 Cognomics 的時序對齊。

Q2. 環境變數 × 生理指標

在 Uedu Fit / Uedu Brain 收集到的 HRV、睡眠品質,是否與前一日環境暴露(空品、溫差、UV)有關聯?這需要 Environomics × PhysioNeuromics 的個體層級資料融合。

Q3. 跨校環境暴露的不平等

不同地理位置的學校,其學生長期暴露於不同等級的環境變數,是否構成另一種「資源不平等」?這是 Educational Omics × Fairness 的研究方向。

Q4. 教室層級 vs 戶外層級的解析度差

政府測站是「戶外公開資料」,但學生實際上多在教室內。教室與戶外的環境差異有多大?這需要結合 Uedu 自製 IoT 感測裝置(規劃中)做共置量測。

7. 歡迎隨時來信討論

以下三個問題給所有讀者(無論是否參加 5/20 當天的小聚)。如果讀完後您有想法,歡迎透過頁尾任一管道分享或來信。

1. 您所在學校或研究團隊,目前對「學習者所處環境」的資料蒐集有哪些做法或缺口?

(共享現況,找到可互補的基礎建設)

2. 如果您的學科可以接上 Environomics 資料,您最想問的第一個研究問題是什麼?

(從學科專業角度提出 hypothesis)

3. 在政府開放資料的「使用 vs 二次發行」這條線上,您的研究實務經驗中有什麼觀察或顧慮?

(治理與倫理面,研究端的視角)

8. 會後補充(5/20 之後更新)

當天討論的重點摘要、與會者提出的延伸問題、會中提到的補充資源,將於 5/20 之後補回此區塊。歡迎之後再回來看看。

讀到這裡,下一步可以怎麼做?

無論您 5/20 當天能否參加,以下三條路徑都歡迎您:

A. 報名深度參與

成為下次小聚的核心成員,提早收到議程與背景資料,參與長期研究網絡。

前往報名
B. 訂閱旁聽通知

每月小聚前收到提醒,當天有空再參加,沒空也能事後看摘要。

訂閱通知
C. 直接來信合作

對 Environomics 或其他 Educational Omics 維度的研究合作有興趣,歡迎隨時來信。

寄信給張家凱
張家凱 助理教授|國立中央大學 通識教育中心

本頁將持續維護為公開閱讀資料。引用本頁可使用:

https://uedu.tw/research/meetup/2026-05-environomics