การประมวลผลคุณลักษณะ

Feature Engineering

รหัสกระบวนวิชา : ว.คพ. 371 (204371)
ลักษณะกระบวนวิชา : บรรยายและปฏิบัติการ
หน่วยกิต : 3(2-2-5)
คำอธิบายลักษณะกระบวนวิชา

เป็นวิชาที่มีทั้งการบรรยายและปฏิบัติการ เนื้อหาครอบคลุมเรื่องภาพรวมของวิศวกรรมคุณลักษณะ ความเข้าใจคุณลักษณะ กระบวนการปรับปรุงคุณลักษณะ การสร้างคุณลักษณะ การสกัดคุณลักษณะ การลดมิติและการฝังตรึงข้อมูล

ผลลัพธ์การเรียนรู้ของกระบวนวิชา
  • นักศึกษาสามารถอธิบายคุณลักษณะของข้อมูลและแนวคิดของวิธีการด้านวิศวกรรมคุณลักษณะ
  • นักศึกษาสามารถเลือกขั้นตอนวิธีด้านวิศวกรรมคุณลักษณะที่เหมาะสมกับงาน และเขียนโปรแกรมโดยใช้วิธีการด้านวิศวกรรมคุณลักษณะเพื่อแก้ปัญหาในงานแต่ละแบบได้
  • นักศึกษาสามารถอธิบายและนำเสนอแนวทางการพัฒนานวัตกรรมคอมพิวเตอร์โดยการประยุกต์วิธีการด้านวิศวกรรมคุณลักษณะ รวมทั้งสามารถเขียนรายงานสรุปจากประเด็นที่ศึกษาและนำเสนอแนวคิดของตนในรูปแบบปากเปล่าได้
  • นักศึกษาแสดงพฤติกรรมความเป็นผู้มีจรรยาบรรณทางวิชาชีพ มีวินัย ตรงต่อเวลา รวมทั้งมีความรับผิดชอบต่อตนเองและสังคม
เงื่อนไขที่ต้องผ่านก่อน

ว.คพ. 271 (204271) หรือ ว.วข. 351 (229351)

เนื้อหากระบวนวิชา
หัวข้อ เอกสารบรรยาย เอกสารปฏิบัติการ
ภาพรวมของวิศวกรรมคุณลักษณะ Lecture slide
ความเข้าใจคุณลักษณะ Lecture slide Lab 1 slide
กระบวนการปรับปรุงคุณลักษณะ
  • การทำให้เป็นบรรทัดฐานและมาตราส่วน
  • การแบ่งช่วงข้อมูล
  • การตรวจหาและการบำบัดข้อมูลผิดปกติ
  • การจัดการข้อมูลสูญหาย
  • การเข้ารหัสตัวแปรแจงนับ
  • การแปลงรูปตัวแปรเชิงตัวเลข
Lecture slide (Part 1)
Lecture slide (Part 2)
Lecture slide (Part 3)
Lab 2 slide
Credit Approval dataset
Thyroid Disease dataset
Boston dataset
Lab 3 slide
Adult dataset
การสร้างคุณลักษณะ
  • การรวมหลายคุณลักษณะด้วยการดำเนินการทางสถิติ
  • การรวมคู่คุณลักษณะด้วยฟังก์ชันคณิตศาสตร์
  • การขยายตัวแบบโพลิโนเมียล
  • การกำเนิดคุณลักษณะใหม่
Lecture slide (Part 1)
Lecture slide (Part 2)
Lab 4 slide
Lab 5 slide
การสกัดคุณลักษณะ
  • การสกัดคุณลักษณะสำหรับข้อมูลข้อความ
  • การสกัดคุณลักษณะสำหรับข้อมูลรูปภาพ
  • การสกัดคุณลักษณะสำหรับข้อมูลอนุกรมเวลา
  • การสกัดคุณลักษณะสำหรับข้อมูลสายลำดับ
Lecture slide (Part 1)
Lecture slide (Part 2)
Lecture slide (Part 3)
MFCC
Lab 6 slide
Lab 7 slide
Lab 8 slide
การลดมิติและการฝังตรึงข้อมูล
  • การเลือกสรรคุณลักษณะ
  • การแปลงคุณลักษณะ
Lecture slide (Part 1)
Lecture slide (Part 2)
Lab 9 slide
MODELON dataset
ARCENE dataset
Lab 10 slide
Lab 11 slide
ตำราและเอกสารหลัก
  • Alice Zheng and Amanda Casari. (2018). Feature Engineering for Machine Learning. O'Reilly Media, Inc.
  • Guozhu Dong and Huan Liu. (2020). Feature Engineering for Machine Learning and Data Analytics. CRC Press.
  • Max Kuhn and Kjell Johnson. (2019). Feature Engineering and Selection: A Practical Approach for Predictive Models. CRC Press.
  • Pablo Duboue. (2020). The Art of Feature Engineering: Essentials for Machine Learning. Cambridge University Press.
  • Sinan Ozdemir. (2022). Feature Engineering Bookcamp. Manning Publications Co.
  • Sinan Ozdemir and Divya Susarla. (2018). Feature Engineering Made Easy. Packt Publishing
  • Soledad Galli. (2020). Python Feature Engineering Cookbook. Packt Publishing.
สัดส่วนการให้คะแนน
  • การสอบกลางภาค : 30%
  • การสอบปลายภาค : 30%
  • การสอบย่อย : 10%
  • แบบฝึกหัด/งานที่ได้รับมอบหมาย : 5%
  • โครงงาน : 19%
  • การเข้าชั้นเรียน : 2%
  • วินัยการส่งงาน : 2%
  • การมีจรรยาบรรณทางวิชาชีพ : 2%
การให้ลำดับขั้นผลการศึกษา

ประเมินจากคะแนนการสอบกลางภาค การสอบปลายภาค การสอบย่อย แบบฝึกหัด/งานที่ได้รับมองหมาย โครงงาน การเข้าชั้นเรียน วิจัยการส่งงาน และการแสดงออกของการมีจรรยาบรรณทางวิชาชีพ ตามสัดส่วนคะแนน และประเมินลำดับขั้นผลการศึกษาอิงตามเกณฑ์มาตรฐานเป็นหลัก

เวลาเรียน
Section 1
ชั่วโมงบรรยาย : วันอังคาร เวลา 14:30-16:30น. ห้อง CSB210
ชั่วโมงปฏิบัติการ : วันศุกร์ เวลา 14:30-16:30น. ห้อง CSB308
อาจารย์ผู้สอน : ผศ.ดร.ปภังกร อิ่นแก้ว (E-mail: papangkorn.i@cmu.ac.th)
เวลาสอบ
การสอบกลางภาค : รอนัดหมาย
การสอบปลายภาค : วันที่ 21 ตุลาคม พ.ศ. 2567 เวลา 8:00-11:00น.