วันพฤหัสบดีที่ 20 มกราคม พ.ศ. 2554

Week 9 (19/01/54)


Data Warehouse Process ประกอบด้วย
1.รวบรวมและคัดเลือกข้อมูลจากภายในองค์กรและภายนอกองค์กร(Operational Data +External Data) เพื่อสร้าง meta data ซึ่งเป็นข้อมูลของข้อมูลที่ช่วยให้อธิบายข้อมูล
2.Data Staging(ECTL) คือการคัดเลือกข้อมูลที่ต้องการใช้จาก Database มาเก็บไว้ใน Data Cube  โดยประกอบด้วย
· Extract การคัดเลือกข้อมูลที่ต้องการ
· Clean แก้ปัญหาข้อมูลไม่สม่ำเสมอหรือซ้ำซ้อน
· Transform การแปลงสภาพข้อมูลให้อยู่ในสภาพที่สามารถนำไปใช้ประโยชน์ต่อได้
·  Load การโหลดข้อมูลที่ได้ลงใน data cube
3.Data Warehouse Business Subject การสร้าง Data warehouse โดยคำนึงถึงมุมมองของ Business Subject
4.Business View
5.Information Catalog

Data Mart
คือ Data warehouse ขนาดเล็กซึ่งสร้างขึ้นเพื่อการใช้งานภายในแผนกหนึ่งๆขององค์กร โดยแบ่งเป็น 2 ประเภท คือ
1.Replicated Data Mart พบมากที่สุด โดยมี data warehouse ในส่วนของ Enterprise มาก่อน และแต่ละแผนกก็มี data mart เป็ยของตนเอง
2.Stand – alone data marts  องค์กรไม่พร้อมทำ enterprise data warehouse แต่ละแผนกเลยสร้าง data mart ของของตนเองเพื่อใช้งาน

Data Cube (OLAP)
คือ ฐานข้อมูลที่มีหลายมิติ(Multi Dimensional Database) ซึ่งช่วยเพิ่มความรวดเร็วของการ
·Queries การสอบถามหรือตั้งคำถามกับระบบ
·Slice & dice of Information
·Roll up
·Drill down การลงรายละเอียดข้อมูล

Business Intelligence
คือ การรวมเครื่องมือในการทำงานต่างๆ เช่น ฐานข้อมูล application และ วิธีการ เพื่อทำให้สามารถที่จะจัดการข้อมูลได้ดี และพร้อมที่จะนำเสนอข้อมูลต่อผู้บริหารเพื่อสามารถวิเคราะห์ข้อมูลต่างๆได้ อย่างมีประสิทธิภาพ
·ตัวอย่าง BI Function and Feature
1.Dashboard เป็นการนำเสนอผลการดำเนินงานในรูปแบบกราฟ โดยแบ่งเป็น 3 ลักษณะ
o Operational dashboards
o Tactical dashboards
o Strategic dashboards
2.Balance scorecard เป็นการวัด performance ขององค์กร ผ่านมุมมอง 4 ด้าน คือ ด้านการเงิน ด้านกระบวนการภายใน ด้านการเรียนรู้และเติบโต และด้านลูกค้า

Online Analytical Processing (OLTP)
เป็นประเภทของซอฟต์แวร์ที่ช่วยให้ผู้บริหารสามารถเข้าถึงข้อมูลในมุมมองเชิงลึกอย่างรวดเร็ว consistent และ interactive โดยสามารถปรับเปลี่ยนรูปแบบการนำเสนอข้อมูลตามความต้องการของผู้บริหาร

Data Mining
เป็นการ extract ข้อมูลที่ไม่เคยทราบมาก่อนจาก database ขนาดใหญ่เพื่อนำไปใช้ในการตัดสินใจทางธุรกิจ โดยต้องทำกับข้อมูลที่มีจำนวนมากถึงแสนหรือล้าน record ซึ่งประโยชน์ของ Data Mining ขึ้นอยู่กับผู้ใช้ว่าจะสามารถตีความข้อมูลที่นำเสนอได้มากแค่ไหน
·Mining Process  เป็นรวบรวมข้อมูลจากที่ต่างๆ ทั้ง Warehouse และแหล่งอื่นๆ และผ่านกระบวนการ ECTLและ Mining เพื่อวิเคราะห์และประมวลผลข้อมูล 
·Yield from Data Mining
o Clustering  การจัดกลุ่มข้อมูล โดยใช้ความสัมพันธ์ของตัวข้อมูลเอง
o Classification การจำแนกข้อมูล โดยผู้ใช้เป็นผู้กำหนดเกณฑ์ในการจำแนก
o Association ดูผลกระทบของข้อมูลกลุ่มหนึ่งต่อข้อมูลอีกกลุ่มหนึ่ง
o Sequence discovery
o Prediction

Text Mining
เป็นการ mining ข้อมูลที่มีรูปแบบแบบ Non-structured หรือ ข้อมูลที่ไม่มีรูปแบบชัดเจน ไม่สามารถคำนวณได้ เช่น ความคิดเห็นของลูกค้า ซึ่งเครื่องมือนี้จะช่วยในการหา hidden content จากข้อมูลที่ไม่มีรูปแบบ และจับกลุ่มข้อมูลที่มีลักษณะเดียวกันเข้าด้วยกัน

ไม่มีความคิดเห็น:

แสดงความคิดเห็น