วันพฤหัสบดีที่ 20 มกราคม พ.ศ. 2554

Week 9 (19/01/54)


Data Warehouse Process ประกอบด้วย
1.รวบรวมและคัดเลือกข้อมูลจากภายในองค์กรและภายนอกองค์กร(Operational Data +External Data) เพื่อสร้าง meta data ซึ่งเป็นข้อมูลของข้อมูลที่ช่วยให้อธิบายข้อมูล
2.Data Staging(ECTL) คือการคัดเลือกข้อมูลที่ต้องการใช้จาก Database มาเก็บไว้ใน Data Cube  โดยประกอบด้วย
· Extract การคัดเลือกข้อมูลที่ต้องการ
· Clean แก้ปัญหาข้อมูลไม่สม่ำเสมอหรือซ้ำซ้อน
· Transform การแปลงสภาพข้อมูลให้อยู่ในสภาพที่สามารถนำไปใช้ประโยชน์ต่อได้
·  Load การโหลดข้อมูลที่ได้ลงใน data cube
3.Data Warehouse Business Subject การสร้าง Data warehouse โดยคำนึงถึงมุมมองของ Business Subject
4.Business View
5.Information Catalog

Data Mart
คือ Data warehouse ขนาดเล็กซึ่งสร้างขึ้นเพื่อการใช้งานภายในแผนกหนึ่งๆขององค์กร โดยแบ่งเป็น 2 ประเภท คือ
1.Replicated Data Mart พบมากที่สุด โดยมี data warehouse ในส่วนของ Enterprise มาก่อน และแต่ละแผนกก็มี data mart เป็ยของตนเอง
2.Stand – alone data marts  องค์กรไม่พร้อมทำ enterprise data warehouse แต่ละแผนกเลยสร้าง data mart ของของตนเองเพื่อใช้งาน

Data Cube (OLAP)
คือ ฐานข้อมูลที่มีหลายมิติ(Multi Dimensional Database) ซึ่งช่วยเพิ่มความรวดเร็วของการ
·Queries การสอบถามหรือตั้งคำถามกับระบบ
·Slice & dice of Information
·Roll up
·Drill down การลงรายละเอียดข้อมูล

Business Intelligence
คือ การรวมเครื่องมือในการทำงานต่างๆ เช่น ฐานข้อมูล application และ วิธีการ เพื่อทำให้สามารถที่จะจัดการข้อมูลได้ดี และพร้อมที่จะนำเสนอข้อมูลต่อผู้บริหารเพื่อสามารถวิเคราะห์ข้อมูลต่างๆได้ อย่างมีประสิทธิภาพ
·ตัวอย่าง BI Function and Feature
1.Dashboard เป็นการนำเสนอผลการดำเนินงานในรูปแบบกราฟ โดยแบ่งเป็น 3 ลักษณะ
o Operational dashboards
o Tactical dashboards
o Strategic dashboards
2.Balance scorecard เป็นการวัด performance ขององค์กร ผ่านมุมมอง 4 ด้าน คือ ด้านการเงิน ด้านกระบวนการภายใน ด้านการเรียนรู้และเติบโต และด้านลูกค้า

Online Analytical Processing (OLTP)
เป็นประเภทของซอฟต์แวร์ที่ช่วยให้ผู้บริหารสามารถเข้าถึงข้อมูลในมุมมองเชิงลึกอย่างรวดเร็ว consistent และ interactive โดยสามารถปรับเปลี่ยนรูปแบบการนำเสนอข้อมูลตามความต้องการของผู้บริหาร

Data Mining
เป็นการ extract ข้อมูลที่ไม่เคยทราบมาก่อนจาก database ขนาดใหญ่เพื่อนำไปใช้ในการตัดสินใจทางธุรกิจ โดยต้องทำกับข้อมูลที่มีจำนวนมากถึงแสนหรือล้าน record ซึ่งประโยชน์ของ Data Mining ขึ้นอยู่กับผู้ใช้ว่าจะสามารถตีความข้อมูลที่นำเสนอได้มากแค่ไหน
·Mining Process  เป็นรวบรวมข้อมูลจากที่ต่างๆ ทั้ง Warehouse และแหล่งอื่นๆ และผ่านกระบวนการ ECTLและ Mining เพื่อวิเคราะห์และประมวลผลข้อมูล 
·Yield from Data Mining
o Clustering  การจัดกลุ่มข้อมูล โดยใช้ความสัมพันธ์ของตัวข้อมูลเอง
o Classification การจำแนกข้อมูล โดยผู้ใช้เป็นผู้กำหนดเกณฑ์ในการจำแนก
o Association ดูผลกระทบของข้อมูลกลุ่มหนึ่งต่อข้อมูลอีกกลุ่มหนึ่ง
o Sequence discovery
o Prediction

Text Mining
เป็นการ mining ข้อมูลที่มีรูปแบบแบบ Non-structured หรือ ข้อมูลที่ไม่มีรูปแบบชัดเจน ไม่สามารถคำนวณได้ เช่น ความคิดเห็นของลูกค้า ซึ่งเครื่องมือนี้จะช่วยในการหา hidden content จากข้อมูลที่ไม่มีรูปแบบ และจับกลุ่มข้อมูลที่มีลักษณะเดียวกันเข้าด้วยกัน

วันพุธที่ 12 มกราคม พ.ศ. 2554

Week 8 (12/01/54)

ระบบ(System)
  • ต้องมีวัตถุประสงค์ก่อน เพราะจะเป็นตัวกำหนด output ออกมา
  • ประกอบไปด้วย Input Process Output 
  • มีการ Control feedback เพื่อประเมินว่า Output เป็นไปตามวัตถุประสงค์ที่ต้องการหรือเปล่า
Data VS Information
  • massage เป็นได้ทั้ง data และ information 
  • ปัจจัยที่กำหนดว่า massage นั้นเป็น data หรือ information คือ ผู้รับ massage 
  • ถ้า massage นั้นส่งผลกับการตัดสินใจของผู้รับ massage นั้นก็จะเป็น Information 
  • ตัวอย่างเช่น Twitter , Facebook จะถือว่าเป็น data เพราะไม่ได้ให้สารสนเทศ ไม่มีการใส่ input process  ส่วน www.amazon.com เป็นสารสนเทศ เพราะมีการใส่ input ในที่นี้คือเป็นคำสั่งซื้อ แล้วระบบจะประมวลผล ออกมาให้ตรงกับคำสั่งขาย
องค์ประกอบของสารสนเทศ
  1. Hardware
  2. Software
  3. Data
  4. Network
  5. Procedure
  6. People
Data Management
  1. Data profiling
  2. Data quality management
  3. Data intergration
  4. Data augmentation
Data life cycle process
  1. New data collection
  2. Stored in a database
  3. Users access the database and take a copy of the needed data for analysis
  4. Use Data analysis tools or Data mining tools for analysing
Data Sources
  • Internal Data
  • External Data
  • Personal Data
ลักษณะของ Data warehouse
  1. Organiztion
  2. Consistency
  3. Time variant
  4. Non-volatile
  5. Relational
  6. Client/server