วันอังคารที่ 5 กรกฎาคม พ.ศ. 2554

ข้อมูล CPU multi-core

ข้อมูล CPU  multi-core  มีลักษนะอย่างไร มีข้อดีอย่างไร และแตกต่างจาก CPU เดิมอย่างไร
ให้มีภาพประกอบ



1. ความเป็นมาของ CPU แบบ Multi-Core
แต่ก่อน CPU เป็นลักษณะของชิป(chip) ที่ภายในมีหน่วยประมวลผลอยู่หน่วยเดียวต่อมาความต้องการความสามารถในการประมวลผลมีมากขึ้นก็เริ่มมีการพัฒนาความเร็วของซีพียู (CPU) ให้มากขึ้นไปเรื่อยๆให้พอต่อความต้องการ เมื่อความเร็วนั้นพัฒนาขึ้นมากจนยากที่จะทำต่อไปได้จึงมีการนำ CPU มาใช้เทคนิคให้สามารถประมวลผลได้มากขึ้น เราเรียกว่าไฮเปอร์เทรดดิ้ง(Hyper-Threading) การทำงานแบบไฮเปอร์เทรดดิ้ง ยังมีข้อเสียหลายประการและเทคโนโลยีซีพียู จึงพัฒนามาสู่ยุคของซีพียูแบบหลายหน่วยประมวลผลหรือที่เรียกว่า (core) ซึ่งทำให้การพัฒนา
สมรรถนของซีพียูเป็นไปอย่างก้าวกระโดด

รูปที่ 1  ภาพของซีพียูแบบดูอัลคอร์
(http://features.cgsociety.org/stories/2005_12/cgretro_2005/06_pic.jpg, 2007)
2. เรื่องราวทั่วไปเกี่ยวกับซีพียู
2.1  central processing unit (CPU)
เป็นองค์ประกอบหลักของเครื่องคอมพิวเตอร์  ทำหน้าที่ในการคำนวณหรือประมวลผลชุดคำสั่ง  ประกอบไปด้วยวงจรขนาดเล็กจำนวนมากที่สลับซับซ้อนที่ทำหน้าที่ประมวลผลเชิงตรรกะ(ALU)  และส่วนประกอบหลักภายในซีพียูเป็นดังนี้
มีส่วนประกอบหลักภายในดังนี้
-อินพุต(Input) คือหน่วยที่ทำหน้าที่รับข้อมูล
-เอาท์พุต(Output)  คือหน่วยที่ส่งข้อมูลออก
-Storage Memory คือหน่วยความจำหรือเก็บข้อมูล
ทั้งสามอย่างนี้จะรวมกันเป็นหน่วยประมวลผลหนึ่งหน่วย  ซึ่งจะหมายถึงโปรเซสหรือการประมวลผล(process) ได้ครั้งละ  1  โปรเซส  ต่อหนึ่งหน่วยเวลาของ ซีพียูเมื่อโปรเซส เข้ามาหลายๆ  โปรเซสอย่างต่อเนื่องเราเรียกสิ่งนั้นว่าเทรด  (thread)  การทำไฮเปอร์เทรดดิ้งนี้เปรียบเสมือนสัญลักษณ์ของการจุดประกายการทำให้ ซีพียูได้มาซึ่งการประมวลผลทีละหลายงานพร้อมกัน
2.2 วิวัฒนาการของซีพียู
CPU จาก 8 บิต ถึง 64 บิต
การส่งข้อมูลนั้นจะสูงมาเป็น ชุดๆ  แต่ละชุดนั้นสามารถอ้างที่อยู่(address) ได้กี่ตัว  ก็ใช้เลขบิต(Bit) ตัวนี้เป็นตัวกำหนดว่าสามารถอ้างที่อยู่ ได้มากน้อยเพียงใด  ยิ่งอ้างได้มากนั่นหมายถึงทำให้ส่งข้อมูลเข้าหรืออออกที่ซีพียูตามไปด้วย  ซึ่งไม่ว่าจะทำงานเป็น 8,16,32,64 บิตได้หรือไม่นั้นต้องขึ้นอยู่กับระบบปฏิบัติการที่รองรับการทำงานด้วย
8086, 8088  ซีพียูสำหรับเครื่องคอมพิวเตอร์ ตระกูลเครื่องพีซีหรือคอมพิวเตอร์ส่วนบุคคล(PC) ตัวแรกเป็นผลผลิตของบริษัทอินเทล(Intel) ยักษ์ใหญ่มือวางอันดับหนึ่งของวงการซีพียูนั่นเอง
80286  ยุคเริ่มต้นซีพียูขนาด 16 บิตเริ่มจากซีพียูตัวนี้
80386, 80486  เป็น CPU เบอร์แรกที่ประมวลผลทีละ 32 บิต ทำให้สามารถจัดการหน่วยความจำได้ดีกว่า 80286
Pentium  เนื่องจากเริ่มมีบริษัทอื่นๆ ผลิตซีพียูสำหรับพีซีออกมาแข่งขันกับอินเทลจึงทำให้ CPU รุ่น
ถัดมาของ Intel ไม่ใช้ชื่อเรียกเป็นหมายเลข ใช้เป็นชื่ออื่นแทน
Pentium MMX, AMD K6 3DNOW, Cylix 6X86MX  คือ Pentium ที่เพิ่มความสามารถในเชิงมัลติมิเดีย (MMX สำหรับ Pentium, 3DNOW)
Intel Itanium  Intel ได้ตั้งชื่ออย่างเป็นทางการให้กับ CPU 64 บิตของตัวเองว่า  Itanuim
                จากที่กล่าวมาข้างต้นจะเห็นว่า   ในยุคเริ่มแรกซีพียู เป็นแบบหน่วยประมวลผลเดี่ยว
(single-core) แล้วจึงพัฒนาเป็นหลายหน่วยประมวลผล(multi-core)  ซึ่งคาดว่าจะพัฒนาต่อไปอีกในอนาคตอาจจะมีชิปที่มีหน่วยประมวลมากมาย(many-core)  ดังกราฟข้างล่าง แสดงถึงการพัฒนาของCPU ควบคู่กับประสิทธิภาพและการใช้พลังงาน
Tear-leap to parallelism
รูปที่ 2  แสดงกราฟวิวัฒนาการของ CPU จนเป็น Dual-core (Intel, 2007)
เมื่อซีพียูในช่วงแรกมีหน่วยประมวลผลอยู่หน่วยเดียวและทำงานด้วยความเร็วต่ำอยู่  ซึ่งจุดประสงค์หลักของการทำซีพียูที่ดีนั้น นักวิชาการก็มองว่ามีดังต่อไปนี้คือ  ต้องมีความเร็วนาฬิกา(clockspeed) ที่สูงหมายถึงการประมวลผลได้เร็ว  แคชหรือหน่วยความจำภายใน(Cache)  ขนาดใหญ่  ทำให้ไม่ต้องเสียเวลาในการสลับสับเปลี่ยนข้อมูลจากหน่วยความจำหลัก(Main Memory) บัสที่สูงที่จะทำให้ซีพียูนั้นตอบสนองได้เร็วเนื่องจากเป้นเสมือนช่องทางเดินของสัญญาน  และซีพียูที่ทำงานติดต่อกันได้เป็นเวลานาน  ทนทานและใช้พลังงานต่ำ
2.3 Hyper-Threading (Intel, 2000)
การทำงานจะทำการจัดการข้อมูลต่างๆที่วิ่งเข้า-ออก  (I/O) ได้มากกว่า 1 เทรดเมื่เปรียบเทียบกับการทำงานในซีพียูปกติที่ไม่ได้เป็นไฮเปอร์เทรดดิ้งการที่ซีพียูทำงานส่งข้อมูลประมวลผลนั้น จะสามารถใช้แบนวิทหรือช่วงทางเดินสัญญาณ (Bandwidth)  มากขึ้นเพียง 35% เท่านั้นเองต่อการทำงานหนึ่งอย่าง แต่ถ้าเป็นดูอัลซีพียูหรือซีพียูสองตัว(Dual CPU) สามารถทำงานได้เร็วกว่าถึงเกือบสองเท่า และส่งงานต่างๆ ออกมาให้ทำทีละสองชิ้น (2 Thread) พร้อมกันอย่างแท้จริง  แต่การทำงานแบบไฮเปอร์เทรดดิ้งนั้นเป็นการทำงานกับโปรเซสได้ทีละมากกว่า 1 process  ต่อหนึ่งหน่วยเวลา  โดยเป็นการใช้เทคนิคของตารางงานซีพียู(CPU Schedule)  และหน่วยความจำภายในเพื่อทำให้ซีพียู จัดการโดยที่ไม่เพิ่มหน่วยประมวลผล(core)  ผลที่ได้ทำให้ได้ความเร็วในการประมวลผลเพิ่มขึ้นมาจากชิปยุคเดิมเล็กน้อย  ปัจจุบันวันนี้ซีพียูทั้งหมดเป็นไฮเปอร์เทรดดิ้ง  ซึ่งทำให้พูดได้ว่าไฮเปอร์เทรดดิ้งเป็นเทคโนโลยีพื้นฐานที่จำเป็นต้องเพิ่มเข้าไปในซีพียูยุคปัจจุบัน

รูปที่ 3  แสดงการทำงานของไฮเปอร์เทรดดิ้ง (Intel, 2007)
3. ข้อมูลทั่วไปของซีพียู Multi-Core
ภายใน Chip CPU  นั้นมีหน่วยประมวลผลย่อย  ที่เราเรียกว่าคอร์มากกว่า  แต่ละคอร์มีหน่วยความจำหลักเป็นของตัวเอง  เรียกว่าแคชระดับที่1 หรือ  L1(Cache L1)แต่ละแกนอาจจะมีการใช้หน่วยความจำร่วมกันเรียกว่าแคช L2   การเข้าถึงข้อมูลที่อยู่ภายในแคช L1  นั้นสามารถทำได้รวดเร็วกว่าการเข้าถึงแคช L2  หรือการเข้าถึงข้อมูลจากหน่วยความจำหลัก  แต่การออกแบบโครงสร้างซีพียูนั้น  จะต้องมีส่วนที่ทำงานร่วมกันได้ด้วย  เพื่อที่จะทำให้สามารถประมวลผลร่วมกันได้ซึ่งส่วนที่จำทำงานร่วมกันก็คือแคช L2 นั่นเอง
Dual-core

Quad-core

รูปที่ 4 แสดงความโครงสร้างโดยคร่าวของ  Dual-Core, Quad-Core (http://en.wikipedia.org/wiki/Multi-core, 2007)
3.1 Cache Memory
แคช(cache)  คือน่วยความจำขนาดเล็กที่มีความเร็วสูงซึ่งเก็บข้อมูล หรือคำสั่งที่ถูกเรียกใช้หรือเรียกใช้บ่อยๆ ข้อมูลและคำสั่งที่เก็บอยู่ในแคชซึ่งทำงานโดยใช้ SRAM(STATIC RAM) จะถูกดึงไปใช้งานได้เร็วกว่าการดึงข้อมูลจากหน่วยความจำหลัก(MAIN MEMORY)ซึ่งใช้  DRAM (DYNAMIC RAM )หลายเท่าตัวดดยในแคชของซีพียูแบบมัลติคอร์นั้น  ก็มีถึงสองระดับคือแคช L1  และแคช  L2  ซึ่ง  ซึ่งขนาดของแคชนั้นก็จะแตกต่างกันออกไปแล้วแต่รุ่นของซีพียูนั้นๆ แต่โดยส่วนใหญ่ในขณะนี้(ปี  2550)  มีขนาดอยู่ที่  2-4 เมกกะไบท์โดยประมาณ
3.2 Clock Speed
ใช้อธิบายความถึงสมรรถนะของซีพียู  บอกถึงความเร็วในการประมวลผล ตัวอย่างเช่น ซีพียูที่มีความเร็วสัญญาณนาฬิกา(Clock Speed) 3.2 GHz. สามารถทำงานได้เร็ววกว่า ซีพียูที่มีความเร็วสัญญานนาฬิกา 2.8 GHz ความเร็วสัญญานนาฬิกาเรียกอีกอย่างหนึ่งว่า Clock rate คือ ความเร็วที่ซีพียูประมวลผลคำสั่ง  มีหน่วยวัดเป็นรอบต่อวินาทีหรือเฮิร์ท(Hz)  เครื่องคอมพิวเตอร์ทุกเครื่อง ต้องมีระบบสร้างสัญญาณนาฬิกาภายใน เพื่อใช้เป็นสัญญาณอ้างอิง ในการจัดระเบียบการประมวลผลคำสั่ง และควบคุมการทำงานของอุปกรณ์ต่างๆ ให้สอดคล้องกันอีกด้วย
ในซีพียูแบบมัลติคอร์นั้น  มิได้เน้นการพัฒนาทางด้านการเพิ่มความเร็วของสัญญานนาฬิกามากมายนักเนื่องจากการเพิ่มความเร็วของสัญญานนาฬิกา  จะเป็นการเพิ่มความต้องการพลังงาน  ซึ่งเป็นผลทำให้ความร้อนก็เพิ่มขึ้นด้วย
4. Dual-Core CPU
ดูอัลคอร์ (Dual-core) เป็นเทคโนโลยีการประมวลผลแบบคู่ขนาน โดยการอาศัยหน่วยประมวลผลอิเล็กทรอนิกส์หลายตัว มาคำนวณปัญหาที่ซับซ้อนร่วมกัน ซึ่งพัฒนาการล่าสุดของเทคโนโลยีดังกล่าว คือการสร้างชิปที่มีกำลังประมวลผล เทียบเท่าไมโครโพรเซสเซอร์ 2 ตัวโดยพื้นฐานคือการนำไมโครโปรเซสเซอร์ 2 ตัวมารวมกันไว้ในแพ็คเกจชิปเดียวกัน การทำงานจะเสมือนระบบซิงเกิลคอร์ที่ซัพพอร์ตเทคโนโลยีมัลติเธรด (Multithread) คือสามารถทำงานหลายๆงานหรือหลายๆเธรดได้ในเวลาเดียวกัน แต่ต่างกันตรงความเร็วที่ต่ำกว่าและกินไฟน้อยกว่า เมื่อมีหน่วยประมวลผลสองหน่วย จะทำให้สามารถทำงานได้สองเทรดอย่างแท้จริง เนื่องจากมีหน่วยประมวลผลสองหน่วยจริงๆ แตกต่างจากการทำเทคนิคของซีพียูแบบไฮเปอร์เทรดดิ้ง ซึ่งจะแสดงให้เห็นได้ชัดเจนมากขึ้นดังรูป

รูปที่ 5  แสดงการทำงานของดูอัลคอร์  (Intel, 2007)
4.1 ประโยชน์ของ Dual-core
ชิปประเภทดูอัลคอร์นั้นเป็นที่นิยมแพร่หลายในปัจจุบัน(2007) สำหรับเครื่องคอมพิวเตอร์ส่วนบุคคลประโยชน์ของมันคือการทำงานแบบหลายงานได้ใน  เวลาเดียวกันดังที่ได้อธิบายไปแล้วในแง่ของความเร็วซีพียูแบบดูอัลคอร์จะประมวลผลได้เร็วกว่าซีพียูแบบซิงเกิลคอร์เนื่องจากเป็นการทำงานของหน่วย ประมวลผลสองหน่วยจะช่วยกันทำงานพร้อมกันในแง่ของความประหยัดพลังงานดังที่กล่าวไปข้างต้นแล้วว่าการพัฒนาซีพียูแบบมัลติคอร์นั้น  จะไม่เน้นการความเร็วของสัญญานนาฬิกาแต่จะเน้นในเรื่องของการเพิ่มจำนวนของคอร์ทำให้ความเร็วเพิ่มขึ้นเกือบสองเท่าดังนั้นการใช้พลังงานจะลด  ต่ำลงกว่าชิปที่มีความเร็วสัญญานนาฬิกาที่สูงในแง่ของความมีเสถียภาพเป็นผลพวงมาจากการใช้พลังงานที่ต่ำทำให้ความร้อนไม่สูงมาก จึงสามารถทำงานได้อย่างต่อเนื่อง  ในส่วนของเปรียบเทียบข้อมูลทางเทคนิคในการพัฒนาซีพียูแบบมัลติคอร์ (multi-core optimization) จะกล่าวถึงในบทต่อไป
4.2  Dual-Core  กับการนำมาใช้งาน
                งานที่เหมาะกับชิปประเภทนี้คืองานที่ต้องการความเร็วในการประมวลผลสูง  เช่นการทำงานเกี่ยวกับมัลติมีเดียซึ่งต้องมีการเรนเดอร์  นั่นหมายถึงนอกจากจะต้องการความเร็วแล้ว  ยังต้องการระยะเวลาในการประมวลผล(CPU Time) พร้อมกับบัฟเฟอร์หรือแหล่งพักข้อมูลที่ใหญ่นั่นหมายความถึงแคชที่มากขึ้นนั่นเอง นอกจากนี้โปรแกรมประยุกต์หรือไม่ว่าจะเป็นเกมส์ใหม่ๆ ยังถูกออกแบบมาเพื่อใช้งานร่วมกับซีพียูแบบดูอัลคอร์อีกด้วย สรุปคือเหมาะกับคอมพิวเตอร์ส่วนบุคคลสมัยใหม่นั่นเอง
5.  Quad-Core CPU
ควอดคอร์ซีพียูหรือชิปแบบที่หน่วยประมวลผลสี่หน่วยเป็นการพัฒนาขั้นต่อมาของดูอัลคอร์  ซึ่งได้เปรียบเทียบให้ดูจากรูปข้างบนหลักการทำงานนั้นเหมือนกันกับดูอัลคอร์  แต่จะมีหน่วยประมวลผลถึงสี่หน่วยประมวลผลนั่นคือสามารถทำงานได้พร้อมกันถึงสี่เทรดเป็นการเพิ่มสมรรถนะของซีพียูขึ้นไปอีก  และได้รวมข้อดีของซีพียูแบบดูอัลคอร์ไว้หมดแล้วไปโดยปริยาย
5.1  ประโยชน์ของ Quad-Core
ชิปประเภทนี้นิยมนำมาใช้งานสำหรับงานที่ต้องการพลังการประมวลผลระดับสูงและการทำงานพร้อมกันทีละหลายงาน  และชิปประเภทนี้ได้รวมเอาข้อดีทั้งหมดของดูอัลคอร์ไว้หมดแล้ว  นั่นคือทั้งความเร็ว  การประหยัดพลังงาน  อุณหภูมิ  แต่ส่วนที่เพิ่มขึ้นมาคือหน่วยประมวลผล  และแคชที่ใหญ่กว่าดูอัลคอร์มาก  ทำให้การทำงานยิ่งรวดเร็วขึ้นไปอีก
5.2  Quad-Core  กับการนำมาใช้งาน
                เป็นที่รู้กันแล้วควัดคอร์รวมเอาข้อดีของดูอัลคอร์ไว้หมดแล้ว  ดังนั้นงานที่ดูอัลคอร์ทำได้ควัดคอร์ก็ย่อมทำได้ดีเช่นกัน   แต่งานที่เหมาะสมกับควัดคอร์นี้จะเป็นงานที่เกี่ยวกับเซิร์ฟเวอร์  เพราะเนื่องจากต้องการความรวดเร็วในการประมวลผล  และมีการเรียกใช้งานกับไคลเอนท์จำนวนมากดังนั้นชิปแบบควัดคอร์นี้จะมีความเหมาะสมในการจัดทำเป็นเซิร์ฟเวอร์  ระยะเวลาในการใช้งานก็มีส่วนมาก  เนื่องจากการทำงานแบบสี่หน่วยประมวลผล  จะสามารถแบ่งเบาภาระงานในการประมวลผลได้  ทำให้การรักษาความร้อนเป็นไปอย่างดีเยี่ยมทำให้สามารถทำงานให้บริการเครื่องลูกข่ายได้อย่างต่อเนื่อง
6.  ข้อมูลทางเทคนิคเกี่ยวกับการพัฒนา
                ในบทนี้เราจะมาดูกันถึงการพัฒนาสมรรถณะของซีพียูแบบมัลติคอร์ว่าเป็นไปอย่างไร  ทั้งในแง่ของความเร็วและพลังงาน  ทำให้เราทราบถึงที่มาของซีพียูลักษณะนี้  และจะกล่าวถึงข้อเสียของซีพียูประเภทมัลติคอร์ด้วย 
6.1  การพัฒนา
การเพิ่มความเร็วให้กับชิปนั้น  เพื่อให้ได้มาซึ่งความสมรรณนะที่เพิ่มขึ้นแล้วโดยหลักก็คือการเพิ่มความเร็วของสัญญานนาฬิกาขึ้นมานั่นเองแต่การกระทำดังกล่าวทำให้ซีพียูต้องใช้พลังงานมากขึ้น  ทำให้เกิดความร้อนสูงตามมาอีกด้วย  ต่อมาเมื่อมีแนวคิดการเพิ่มคอร์ให้กับซีพียูแล้ว  ทำให้การพัฒนาแบบใหม่ถือกำเนิดขึ้นมา  นั่นคือการเพิ่มหน่วยประมวลผลให้แก่ซีพียูปรากฏซ่าผลที่ออกมาเป้นที่น่าพอใจ  นั่นคือซีพียูนอกจากจะทำงานในสมรรถนะที่สูงขึ้นมากแล้วยังใช้พลังงานน้อยกว่าอีกด้วย  ทำให้ได้มีการเพิ่มจำนวนคอร์ให้กับซีพียูเป็นสี่  แปด  หรือมากกว่านั้นทำให้การพัฒนาซีพียูในยุคใหม่นี้นอกจากจะพัฒนาความเร็วสัญญานนาฬิกาแล้ว  ยังเน้นถึงเรื่องการประหยัดพลังงานและการเพิ่มหน่วยประมวลผลด้วยทำให้การพัฒนาซีพียูในยุคนี้เป็นไปอย่างรวดเร็ว
6.2  ข้อดี
1.  การดีไซน์ซีพียูแบบมัลติคอร์ทำให้แคชของแต่ละคอร์ออกแบบมาให้แคบอยู่ใกล้กันกับซีพียูทำให้สัญญาณที่สิ่งระว่างแคชไปที่ซีพียูนั้นเป็นไปอย่างรวดเร็ว
2.  ในแต่ละที่ประกอบไปด้วยซีพียูและแคชนั้นอยู่ใกล้กันมากดังนั้นจึงมีการเพิ่มเทคโนโลยีที่ชื่อว่า  Cache coherency ซึ่งเป็นการทำให้ข้อมูลในแต่ละแคชนั้นเข้าถึงกันได้ สามารถแบ่งงานกันโหลดได้ระหว่างหน่วยประมวลผล
3.  เนื่องจากมัลติคอร์ใช้พื้นที่ของแผงวงจรน้อยกว่า  ทำให้มีสมรรถนะสูงกว่า ขณะที่อัตราการใช้พลังงานยังคงอยู่ในระดับเดียวกันเมื่อเทียบกับซีพียูแบบเดิม  นอกจากนั้น ระบบจัดการความร้อนที่เล็กลงทำให้ใช้ไฟน้อยลงด้วย  จึงช่วยประหยัดพลังงาน แต่ความร้อนกลับน้อยลง เพราะมัลติคอร์ ไม่ได้ใช้งานทุกคอร์ตลอดเวลา
4.  ราคาลดต่ำลงมาเรื่อยๆ  จนในตอนนี้เครื่องคอมพิวเตอร์ส่วนบุคคลใหม่ๆก็เริ่มทยอยกันใช้ซีพียูแบบดูอัลคอร์กันหมดแล้ว

รูปที่ 6  ภาพแสดงโครงสร้างของ  Cache coherency
(http://en.wikipedia.org/wiki/Multi-core, 2007)
6.3  ข้อเสีย
1.  การเพิ่มจำนวนหน่วยประมวลผลให้สามารถบรรจุอยู่ในซีพียูเพียงแค่ตัวเดียวได้นั้นต้องการความละเอียดสูงเป็นหน่วยนาโนเลยทีเดียวนั่นคือปัญห
าของความยากในการผลิตทำให้ซีพียูนั้นมีราคาแพง
2.  Application  ที่จะทำงานร่วมกับมัลติคอร์ได้อย่างมีประสิทธิภาพต้องรองรับการทำงานแบบมัลติคอร์ด้วย 3.การทำงานบางอย่างซิงเกิลคอร์ก็ประมวลได้เรวกว่าดูอัลคอร์อยู่
7.   ผลกระทบที่เกิดจากมัลติคอร์
                การพัฒนาชิปประเภทมัลติคอร์นั้นส่งผลกระทบกับเทคโนโลยีด้านคอมพิวเตอร์หลายอย่างไม่ว่าจะเป็นฮาร์ดแวร์  ซอฟแวร์  เนตเวิร์ค  ก็เปลี่ยนผันพัฒนาไปตามความเร็วของซีพียูที่มีมากขึ้น
7.1  ผลกระทบทางด้านฮาร์ดแวร์
                เมื่อมีการประมวลผลที่รวดเร็วขึ้น ต้องเพิ่มหน่วยความจำหลักเพื่อให้เหมาะสมกับความเร็วของซีพียูนั่นคือการเพิ่มแรมนั่นเองทำ  อีกทั้งการพัฒนาโปรแกรมมีแนวโน้มว่าโปรกแรมจะขนาดใหญ่ขึ้นเรื่อยๆ  การประมวลผลข้อมูลจำนวนมากแน่นอนว่าต้องการแหล่งเก็บข้อมูลขนาดที่เพิ่มขึ้น  ทำให้การเพิ่มแหล่งเก็บข้อมูลนั้นก็จำเป็นไม่แพ้กันนั่นก็คือขนาดของฮาร์ดดิสต้องใหญ่ขึ้นตามมา  การพัฒนาช่องทางการติดต่อ (interface)ก็ต้องได้รับการปรับปรุงเช่นกัน  อาจจะเพื่อการนำสัญญาณที่ดีขึ้นหรือรองรับกับขนาดของชิปทำให้สล๊อต(Slot)  ที่อยู่บนเมนบอร์ดจะต้องมีการปรับเปลี่ยนไป

รูปที่ 7  เมนบอร์ดที่รองรับชิปแบบดูอัลคอร์
(http://www.pantipmarket.com/computer/picture/C5601480.jpg, 2007)
7.2 ผลกระทบทางด้านซอฟท์แวร์
                การประมวลผลเป็นไปอย่างมีสมรรถนะมากขึ้น  ซอฟแวร์ต่างๆจึงมีขนาดใหญ่ขึ้น  และใช้ซีพียูไทม์ได้อย่างเต็มที่เช่นการตัดต่อมัลติมีเดียร์ที่จะมีโปรแกรมที่ความสามารถมากขึ้น  โปรแกรมประยุกต์อื่นๆ  ที่รองรับการทำงานแบบมัลติคอร์ทำให้ประมวลผลได้รวดเร็วขึ้น   หรือว่าจะเป็นการประมวลทศนิยมจำนวนมากๆ ก็ทำได้อย่างแม่นยำมากขึ้น ในเวลาอันเท่าเดิมเมื่อเทียบกับซีพียูแบบซิงเกิลคอร์  และที่เห็นได้ชัดแล้วในปุจจุบันคือเกมส์คอนโซล์ใหม่ๆที่ต้องใช้สเปกเครื่องที่สูงๆเพื่อความสมจริงในการเล่น  จำเป็นที่จะต้องใช้งานซีพียูแบบดูอัลคอร์  การพัฒนาโปรแกรมประยุกต์ก็ได้รับผลกระทบเช่นกัน  การเขียโปรแกรมให้ทำงานโดยดึงข้อดัของมัลติคอร์มาใช้งานนั้นทำเป็นไปอย่างยากขึ้น  การเขียนเทรดจะดีบักโปรแกรมแบบเดิมไม่ได้อีกแล้วเพราะว่าเป้นการประมวลผลแบบสองหน่วยประมวลผลโดยแท้จริง

รูปที่ 8 เกมส์ Star Craft 2 ที่ต้องการซีพียูแบบมัลติคอร์
(http://starcraft2weblog.com/wp-content/uploads/starcraft2screenshot1.jpg, 2007)
7.3  ผลกระทบต่อผู้ใช้งาน
                การใช้งานของผู้ใช้งานเป็นไปในทิศทางที่ดีขึ้นมาก  เพราะว่าแต่ก่อนการทำงานนั้นจะเน้นทำให้เสร็จไปทีละงาน  เนื่องจากข้อจำกัดด้านสมรรถนะของซีพียู  แต่เมื่อมีมัลติคอร์เข้ามามีส่วนช่วยในการประมวลผลแทนที่ชิปแบบเดิมๆ  การทำงานทีละหลายๆอย่างพร้อมกันจะเป็นไปได้อย่างดีเยี่ยมมากขึ้น  ผู้ใช้งานอาจจะฟังเพลง  เรนเดอร์งานมัลติมีเดียร์  และเล่นเกมส์ไปด้วยในเวลาเดียวกันได้เลยก็สามารถทำได้  เนื่องจากการที่มีหน่วยประมวลผลหลายหน่วยนั่นก็หมายถึงการงานได้ทีละหลายๆงาน  หรือว่าจะเป็นส่วนติดต่อกับผู้ใช้(User Interface) แบบใหม่ที่ต้องใช้กำลังการประมวลผลเช่น มัลติทัชสกรีน ก็จะเป็นเรื่องที่ไกล้ตัวเรามากยิ่งขึ้น อีกทั้งแนวโน้มในการใช้งานก็จะมีการใช้งานซีพียูแบบมัลติคอร์กันอย่างแพร่หลายจากข้อดีของมันนั่นเอง ดังที่ได้เห็นทุกวันนี้การเลือกซื้อคอมพิวเตอร์ใหม่ๆ ก็จะถามถึงแต่มัลติคอร์ซีพียูกันทั้งนั้น ไม่ว่าจะเป็นเครื่องคอมพิวเตอร์ส่วนบุคคล หรือเมนเฟรมก็ตามแต่
8.  การเลือกซื้อซีพียูแบบมัลติคอร์
การเลือกซื้อมีหลักการดังต่อไปนี้
1. ความต้องการว่าท่านต้องการซื้อมัลติคอร์ซีพียูไปทำอะไร
2. ประเภทการใช้งานว่าการใช้งานเกี่ยวกับด้านไหน  เป็นการใช้งานทั่วไปหรือเฉพาะทาง
3. ความเร็วของซีพียูว่าเพียงพอต่อความต้องการของโปรแกรมที่ท่านจะนำไปใช้งานหรือไม่
4. หน่วยความจำภายในหรือแคชต้องมีขนาดใหญ่พอและเหมาะสมกับองค์ประกอบโดยรวม
5. องค์ประกอบโดยรวมของเครื่องนั่นคือต้องมีความสัมพันธ์ระหว่างหน่วยความจำ ความเร็วเครือข่าย ความสามารถของการ์ดแสดงผล ความจุข้อมูล ความสามารถในการจ่ายไฟ เป็นต้น
6. ราคาต้องไม่แพงเกินกว่าที่จะซื้อหามาได้
7. ประกัน  แม้ว่าจะไม่ส่งผลต่อการใช้งาน  แต่ก็เป็นสิ่งที่จำเป็นเช่นกันหากมีความเสียหายที่เกิดขึ้นกับชิป
8.1  ระดับของการใช้งานแต่ละประเภท
8.1.1 Home User / Office
เน้นไปที่ใช้งาน application ทั่วไป  มีเสถียรภาพ   จะเลือกชิปที่ไม่ต้องแพงแคชไม่มากและความเร็วไม่ต้องสูง    เพื่อจะได้ราคาที่คุ้มค่าที่สุด  เช่น
Chip : Sempron64,Athlon64,Core2Duo
Clock :2200~3000 GHz
Cache : 512~1024 KB

8.2.2 Notebook
ทำงานได้ในลักษณะที่เหมือนกับ Home User   เน้นไปที่การประหยัดพลังงาน
เลือกชิปที่ออกแบบมาสำหรับ notebook โดยเฉพาะของแต่ละค่ายและราคาจะสูงกว่าปกตินิดหน่อยเช่น
Chip : Turion64,PentuimM
Clock :2000~2800 GHz
Cache : 512~1024 KB
8.2.3 Developer
สำหรับนักพัฒนาที่ต้องการใช้ในการเขียนโปรแกรม    ต้องการความรวดเร็วและหน่วยความจำจำนวนมาก   มีเสถียรภาพใช้งานได้อย่างต่อเนื่อง   ประมวลผลได้ทีละหลายงานพร้อมกัน   จะเลือกหาชิปที่มีขนาดของ clock สูงๆ
Chip : Core2Extreme , Athlon64X2
Clock :3800~4500 GHz
Cache : 2~4 MB
8.2.4 Multimedia
สำหรับนักพัฒนาที่ต้องการใช้ในการเขียนโปรแกรม   ต้องการความรวดเร็วและหน่วยความจำจำนวนมาก มีเสถียรภาพใช้งานได้อย่างต่อเนื่องเป็นเวลานานจะเลือกหาชิปที่มีขนาดของ  cache มากๆ
Chip : Core2Quad , Athlon64X2
Clock :3200~3800 GHz
Cache : 4~6 MB
8.2.5 Workstation
ต้องการความทนทาน  สามารถใช้งานได้อย่างต่อเนื่องและต้องการหน่วยความจำจำนวนมาก  ดังนั้นจึงแสดงตัวอย่างสเปกเครื่องดังนี้
Intel? Core? 2 Extreme quad-core Xeon
Clock : 2.66-3.00 GHz
Mfg. Process : 65 nm
Transistors 582 million
Addressable Memory : 64 GB
Cache L2 : 8 MB
Bus : 1066-1333 MHz
นอกจากนี้ก็ยังมีของค่ายอื่นๆเช่น UltraSPARC T2, T1 , Cell(IBM)
8.2.6 Mainframe
มีความปลอดภัย  อุณหภูมิต่ำ  ทำงานอย่างต่อเนื่อง  มีความรวดเร็วใช้หน่วยความจำมากเราจะใช้ CPU ที่มีคุณภาพสูงเป็นรุ่นที่ออกแบบ
มาเพื่อนเฉพาะรุ่นที่รองรับกับอุปกรณ์และระบบปฏิบัติการของเมนเฟรมนั้นๆจะขายเป็นชิปและอุปกรณ์ต่อพ่วงต่างๆที่สามารถทำงานเข้ากันได้ดี  อย่างเช่นชุดเซฟเวอร์ของ  IBM, SunMicrosystem   เป็นต้น
9.  แนวโน้มในอนาคตและบทสรุป
                การพัฒนาชิปและเทคนิคตั้งแต่อดีตจนถึงปัจจุบันเป็นไปอย่างรวดเร็วในแง่ของสมรรถนะและปัจจุบันยังเน้นถึงประสิทธิภาพในการใช้พลังงานให้คุ้มค่ามากที่สุดอีกด้วย  และในบทนี้จะกล่าวถึงแนวโน้มในอนาคตและบทสรุปของเรื่องราวเกี่ยวกับซีพียูแบบมัลติคอร์อีกด้วย
9.1  TeraSacle
                เทอราสเกลหรือบางค่ายก็เรียกว่าเทอราฟล็อบส์(Teraflops)แต่ในที่นี้จะเรียกรวมว่าเทอราสเกลเป็นเทคโนโลยีซีพียูแบบหลายคอร์ที่กำลังพัฒนา  และจะเปิดตัวใช้งานในอนาคตอันใกล้นี้แนวคิดนี้มาจากการเพิ่มจำนวนหน่วยประมวลผลเข้าไปในซีพียทำให้ประสิทธิภาพในการใช้พลังงานเพิ่มขึ้น  โดยเริ่มจากการเพิ่มจำนวนคอร์เป็นสอง  นั่นก็คือซีพียูแบบดูอัลคอร์ที่ประหยัดพลังงานและทำงานได้เร็วกว่าซิลเกิลคอร์  และเพิ่มคอร์เป็นสี่  ก็ทำให้ได้ซีพียูแบบควัดคอร์ที่ทำงานได้เร็วและใช้พลังงานอย่างมีประสิทธิภาพมากกว่าดูอัลคอร์  ดังนั้นจึงมีแนวคิดการเพิ่มจำนวนคอร์ให้มากๆเป็น   Many Core ซีพียู  หรือซีพียูที่มีหน่วยประมวลผลมากมายภายในชิปตัวเดียว
                ข้อดีของเทอราสเกลนั้นทำให้หน่วยประมวลผลที่มีมากมายสามารถถูกแบ่งออกมาประมวลผลเฉพาะด้านและแบ่งเบาภาระงานกันเองได้เนื่องจา
กโครงสร้างของชิปแบบเทอราสเกลในหนึ่วงหน่วยประมวลผลนั้นนั้นแบ่งออกเป็นCore  หรือหน่วยประมวลผลทำหน้าที่ประมวลผลทำหน้าประมวลผล
Internal Cache  หรือแคช L1 นั่นเองซึ่งหน่วยความจำภายใน
Shared Cache  หรือแคช L2  เพื่อให้แต่ละตัวทำงานร่วมกัน
Routing  เป็นส่วนที่เพิ่มเข้ามาใหม่  เมื่อมีหน่วยประมวลผลจำนวนมากจะต้องมีตัวที่คอยจัดการการทำงานร่วมกันของแต่ละหน่วยประมวลผล
ส่วนการวางตัวเรียงกันของหน่วยประมวลผลคล้ายกับการปูกระเบื่องจึงเรียกโครงสร้างแบบนี้ว่าสถาปัตยกรรมซีพียูแบบ  Tiled Processor
tiled-01
รูปที่  9  แสดงโครงสร้างแบบ  Tiled  ของเทอราสเกล
(PC Perspective, 2007)
ซีพียูแบบเทอราสเกลนั้นช่วยกระประมวลผลการทำงานดังนั้นจึงทำให้ซีพียูแห่งอนาคตตัวนี้ทำงานที่อุณหภูมิที่ต่ำในความเร็วที่สูงและใช้พลังงาน  อย่างมีประสิทธิภาพมากกกว่าสิ่งที่น่าสนใจประการต่อมาของเทคโนโลยีแบบเทอราสเกลนี้คือการมีหน่วยความจำแบบแนบชิดติดกันกับซีพียูซึ่ง  จะมาแทนที่หน่วยความจำหลักหรือแรมนั่นเองสาเหตุที่เป็นเช่นนั้นก็เพราะว่าการมีหน่วยความจำที่หลักที่ชิดกันกับซีพียูทำให้ระยะทางการเดินทางข้อมูลนั้นสั้นลง  ซึ่งนั่นหมายถึงความเร็วในการทำงานก็จะเพิ่มขึ้นอีกด้วย  เราเรียกว่าการเข้าถึงหน่วยความจำแบบนูม่า (NUMA)
tiled-3d-ram
รูปที่  10  แสดงลักษณะหน่วยความจำแบบนูม่า
(PC Perspective, 2007)
                การนำเทอราสเกลไปประยุกต์ใช้ตอนนี้ยังอาจจะไม่มีใครมองภาพออกด้วยความที่สมรรถนะอันสูงส่งของมัน  อีกทั้งในขณะนี้ยังไม่มีการนำออกมาวางจำหน่ายให้ทดลองกัน  แต่มีการคาดคะเนไว้ว่าความต้องการที่เพิ่มขึ้นของมนุษย์ทำให้ชิปนั้นต้องพัฒนาต่อไปและการนำเทอราสเกลมาใช้ก็เพื่อการประมวลผลที่รวดเร็ว  และทำงานได้ทีละหลายโปรเซส  ซึ่งก็จะตอบสนองต่อความต้องการของเราได้นั่นเอง
9.2  บทสรุป
                ตั้งแต่อดีตความต้องการความเร็วในการประมวลผลของซีพียูเพิ่มขึ้นเรื่อยๆ  มีการพัฒนาเทคนิคต่างๆเพื่อให้ซีพียูประมวลผลได้เร็วขึ้น  ไม่ว่าจะเป็นการเพิ่มความเร็วของสัญญานนาฬิกาการเพิ่มขนาดของแคช  การใช้เทคนิคจัดการตารางงานของซีพียูที่มีคุณภาพ  การเพิ่มจำนวนของหน่วยประมวลผล และเดี๋ยวนี้ยังคำนึงถึงการเพิ่มประสิทธิภาพในการใช้พลังงาน  แต่ดูเหมือนว่าความต้องการพลังในการประมวลผลนั้น  ยังไม่มีวี่แววว่าจะถึงจุดสิ้นสุด  การพัฒนายังคงเป็นไปอย่างต่อเนื่อง และเทคโนโลยีไดที่เราคิดว่าสูงส่ง  อาจจะกลายเป็นแค่ของธรรมดาๆ  ที่มีใช้กันอยู่ทั่วไปในอนาคตอย่างเช่นดูอัลคอร์  ที่ใช้งานกันอย่างแพร่หลายในปัจจุบัน การเปลี่ยนแปลงครั้งยิ่งใหญ่นี้คือการเพิ่มหน่วยประมวลผลทำให้เกิดผลกระทบครั้งใหญ่ต่อวงการคอมพิวเตอร์ ไม่ว่าจะเป็นทางด้านฮาร์ดแวร์  ซอฟท์แวร์  เนตเวิร์ค    หรือยูเซอร์ ก็ต่างเปลี่ยนแปลงไปตามกระแสของชิปกันทั้งหมด  ผลที่ตามมาคือเราสามารถทำงานได้เร็วขึ้น  ทำงานได้หลายอย่างมากขึ้น  และคอมพิวเตอร์ก็ตอบสนองกับเราในสิ่งที่หลากหลายไปกว่าเดิม  เมื่อข้อจำกัดทางด้านของหน่วยประมวลผลถูกพัฒนาไปในทางที่ดีขึ้นเช่นนี้เราเองซึ่งเป็นผู้ใช้งานก็ต้องมีความรู้เกี่ยวกับเทคโนโลยีใหม่ๆอยู่เสมอเพื่อปรับตัว  ให้เข้ากับเทคโนโลยีในปัจจุบันได้อย่างทันสมัยและใช้ประโยชน์จากมันให้ได้มากที่สุด
ในแง่ของการใช้พลังงานนั้นชิปแต่ละตัวที่ถูกส่งออกมาใหม่ๆ  จะเน้นในเรื่องของการใช้พลังงานอย่างมีประสิทธิภาพซึ่งจะช่วยลดปัญหาใหญ่คือภาวะโลกร้อนและเมื่อลดพลังงานก็ทำให้อุณหภูมิลดตามไปด้วย  เราจะพบเห็นชิปที่สามารถทำงานได้อย่างต่อเนื่องเป็นเวลานานๆ
ในแง่ของราคาและการถูกนำมาใช้งานเป็นธรรมดาที่เทคโนโลยีใหม่ๆจะมีราคาที่สูงอาจจะเป็นเพราะความยากในการผลิต  และความต้องการของผู้คน  แต่อุปกรณ์ทางด้านคอมพิวเตอร์เหล่านี้เมื่อถูกวางจำหน่ายแล้ว  มีแนวโน้มว่าจะลดราคาลงอยู่ตลอด  จนเป็นสิ่งที่เราสามารถมีไว้ครอบครองได้และการเลือกสรรนั้นควรเลือกสรรให้เหมาะสมกับการใช้งานอีกด้วยทำให้ในภายภาคหน้าทุกคนคงจะ  ต้องมาใช้มัลติคอร์ซีพียูกันทั้งหมดจนกลายเป้นมาตราฐานที่ทุกคนยอมรับกันในที่สุด  และซีพียูยังคงถูกพัฒนาต่อไป

ความแตกต่างของ CPU

เปรียบเทียบชัดๆ กันระหว่าง พี่-น้อง เทคโนโลยีภายในเพิ่มขึ้นมาสำหรับ CPU ตัวใหม่นี้
Optimized Performance Technologies
1. Dual-Core Architecture : เป็น CPU ที่ออกแบบให้มี คอร์ในการประมวลผล 2 คอร์ภายใน หน่วย ประมวลผลตัวเดียว เพื่อเพิ่มประสิทธิภาพ และยังช่วยในการประหยัดพลังงาน โดยในส่วนของ Core Duo นั้นจะเป็นการ เอา หน่วยประมวลผล 2 ตัวมารวมเข้าด้วยกัน บนชิพ 1 ตัว (เหมือนกับการเอา Pentium M จำนวน 2 ตัวมารวมกัน)
2. Intel Wide Dynamic Execution : เป็นการเพิ่มความสามารถในการประมวลผล โดยแต่เดิมนั้น จะ สามารถทำการคำนวณ ได้ 3 คำสั่งใน 1 Clock แต่ Core2Duo สามารถทำการคำนวณเพิ่มได้เป็น 4 คำสั่งต่อ 1 Clock
3. Intel Advanced Smart Cache : คือ Core 2 Duo ได้ทำการเพิ่ม Cache จากเดิมที่มีแค่ 2MB เป็น 4MB ทำให้มีประสิทธิภาพเพิ่มมากขึ้น และแน่นอนว่าประหยัดไฟเพิ่มขึ้นด้วย
4. Intel? Advanced Digital Media Boost : คือ Core2Duo นั้นได้ทำการเพิ่มประสิทธิภาพในการคิด คำนวณทางด้าน video, speech and image, photo processing, encryption, financial, engineering and scientific เร็วขึ้นกว่า Core Duo ถึง 2 เท่า
5. Intel? Smart Memory Access : เทคโนโลยีนี้ช่วยพัฒนาประสิทธิภาพโดยการ ปรับปรุง Bandwidth บัสระบบ และหน่วยความจำ ซึ่งมันจะลดความล่าช้าในการเข้าถึงข้อมูล ที่อยู่ใน Memory เมื่อ CPU ต้องการ
6. Intel? 64 : Core2duo นี้สามารถใช้ประโยชน์จาก โปรแกรมที่เป็น 64-bit และ Microsoft Window
Vista OS Intelligent Power Capability
1. Advanced Power Gating : เป็นการอนุญาตให้บางส่วนของ CPU สามารถถูกปิดลงไปได้ระหว่างการ ประมวลผลระดับสูง เพื่อปรับปรุงอัตราส่วน ประสิทธิภาพ/พลังงานที่ใช้
2. Enhanced Deep C4 Sleep State : เป็นความสามารถในการประหยัดพลังงาน โดยลด Voltage ของ CPU ลงเมื่อ L2cache หยุดทำงาน
3. Split Bus Array : สามารถนำข้อมูลที่ไม่ต้องการไปอยู่ในสถานะใช้พลังงานต่ำเพื่อ ปรับปรุงการ ประหยัดพลังงาน
4. Intel? Dynamic Power Coordination : คอร์แต่ละคอร์สามารถทำการเปลี่ยนแปลงตัวเองไปอยู่ ใน สถานนะการใช้พลังงานปริมาณต่ำ หรือหลับไปได้เลย
5. Dynamic Cache Sizing : Cor2Duo สามารถทำการผลักข้อมูลทั้งหมดใน Cache ไปยัง Memory เพื่อ การประหยัดพลังงาน
. จะเห็นว่าเทคโนโลยีที่ Intel เพิ่มเข้าไปใน CPU รุ่นใหม่นี้นั้น ล้วนแล้วแต่เป็นการเพิ่มประสิทธิภาพ ในขณะเดียวกันก็พยายาม ลดการใช้พลังงานที่ไม่จำเป็นออกไป ทำให้ค่า ประสิทธิภาพ/พลังงานที่ใช้ มีค่าสูงขึ้น เพื่อเหมาะแก่การเป็น CPU ของโน๊ตบุ๊คที่สามารใช้งานได้เป็นเวลานาน โดยไม่ต้องเสียบปลั๊ก และได้งาน ออกมารวดเร็ว จากบทความจากเว็บไซต์ Intel เองและการทดสอบจากเว็บไซต์คอมพิวเตอร์ต่าง นั้นเห็นด้วยกับคำอ้าง ที่ว่า Core2Duo นั้นสามารถทำงานได้อย่างมีประสิทธิภาพ มากกว่า Core Duo ถึงประมาณ 40% และยัง สามารถประหยัดพลังงานได้มากกว่าเดิมอีกด้วย CPU ตัวนี้ของอินเทล จึงกำลังเป็นที่ต้องการ และจ้องเป็น spec แรก ๆ ของผู้ที่จะซื้อโน๊ตบุ๊คใหม่หลาย ๆคน ส่วนจำเป็นหรือไม่นั้นมันขึ้นอยู่กับการใช้งานของแต่ละคนว่า เอา Notebook ไปใช้งานด้านไหนบ้าง เพราะว่า ตัว Core2Duo ที่ออกมาใหม่นี้ก็มีราคาค่อนข้างสูงในขณะที่ CPU ร่นเก่ากว่า เช่น Core Duo ,Pentium M ก็ลดราคาลงมากันเป็นหลักหมื่น จึงนับว่าเป็นตัวเลือกที่น่าสนใจทีเดียว ก็ขึ้นอยู่กับผู้ใช้แต่ละคน นะครับว่า เราต้องการโน๊ตบุ๊คไปทำอะไร ?

1. รหัสของ CPU ที่เปลี่ยนไปจากเดิม Core Duo จะใช้ T2xxx เปลี่ยนมาเป็นใช้ T7xxx(cache 4MB) ,T5xxx(Cache 2 MB)
2. Cache เพิ่มจาก 2M เป็น 4MB
3. Power(TDP-ค่าพลังงานที่ใช้) ที่ใช้ของ Core2Duo 34W ส่วน CoreDuo 31 W
4. Core2Duo เปลี่ยนชื่อ สถาปัตยกรรม เป็น Merom ส่วน Core Duo ใช้ชื่อ Yonah


ข้อดีของ CPU multi-core 
คือ เราจะเห็นว่าการพัฒนาระบบเทคโนโลยีมีความก้าวหน้ามีการพัฒนาโดยไม่มีการหยุดทำให้มันทันสมัยมากยิ่งขึ้น เมื่อ CPU  แต่ละตัวมีควาทแตกต่างกัน ลักษณะไม่เหมือนกันมันจะมีประโยชน์และดีต่อตัวเราที่ CPU มีการปรับปรุงแก้ไขให้มันดีขึ้นกว่าเดิม  ทำให้มีประสิทธิภาพเพิ่มมากขึ้นและบางรุ่นก็แน่นอนว่าประหยัดไฟเพิ่มขึ้นด้วย

วันอาทิตย์ที่ 3 กรกฎาคม พ.ศ. 2554

รวบรวมวิวัฒนาการ CPU ของ INTEL


            รวบรวมวิวัฒนาการCPU ของ INTEL


         ประวัติความเป็นมาของ CPU ตระกูล Intel1971 : 4004 Microprocessor รุ่นแรกของ Intel ใช้งานในเครื่องคิดเลข
                    หลังจากที่ Intel ออกCPU สำหรับอุปกรณ์พกพาในชื่อว่า Atom ไปเรียบร้อยแล้วนั้น กระแสก็ออกมาแรงเห็นๆ ทั้งกลุ่มผู้ผลิตมากมายก็เจาะตลาดขาย Netbook กันอย่างล้นหลาม Intel นั้นมีตำนานในการผลิต Microprocessor ตั้งแต่ใช้ในเครื่องคิดเลข และพัฒนาต่อยอดขึ้นมาอย่างไม่หยุดยั้ง ซึ่งทำให้เห็นว่าศักยภาพของการพัฒนาที่ไม่มีที่สิ้นสุดนั้น ทำให้เราได้ใช้เทคโนโลยีอย่างไร้ขีดจำกัด อยู่ที่ว่าเงินในกระเป๋าเราจะมีแค่ไหน ที่นี่เรามาย้อนดูวิวัฒนาการตั้งแต่ ปี 1971 จนถึงปัจจุบันกัน
 CPU รุ่นเก่า ๆ ในอดีต
เริ่มจากยุคแรก ๆ สมัยที่มีคอมพิวเตอร์ใช้กันเลยอันนี้ก็เป็นการพัฒนาของ Intel

15 พ.ย. อินเทลเปิดตัว “Intel 4004” รุ่นแรกของโลก

Intel 4004 เป็นชิปไมโครโพรเซสเซอร์รุ่นแรก ที่ทางบริษัทอินเทลเปิดตัวพร้อมจำหน่ายไปทั่วโลก

วันที่ 15 พฤศจิกายน พ.ศ. 2514 (ค.ศ. 1971) หรือเมื่อ 38 ปีที่ผ่านมา ชิปไมโครโปรเซสเซอร์ (Micro Processor) ตัวแรกที่ทาง Intel ได้นำออกสู่ตลาดเป็นครั้งแรก ซึ่งมีชื่อทางการค้าว่า Intel 4004 ซึ่งในขณะนั้น ชิปไมโครโปรเซสเซอร์ตัวนี้มีราคาจำหน่ายอยู่ที่ 200 เหรียญสหรัฐ

Intel 4004 เป็น CPU (Central Processing Unit) ขนาด 4.2 X 3.2 มิลลิเมตร ภายในประกอบด้วย ทรานซิสเตอร์ จำนวน 2250 ตัว และเป็น ไมโครโปรเซสเซอร์ขนาด 4 บิต

ต่อมาปี 1972 Intel ได้ออกไมโครโปรเซสเซอร์ ขนาด 8 บิต โดยใช้ชื่อว่า Intel 8008 มีชุดคำสั่ง 48 คำสั่ง และมีหน่วยความจำ 16 Kbyte และต่อมาในปี 1973 Intel ได้ออกไมโครโปรเซสเซอร์ Intel 8080 ที่มีชุดคำสั่งพื้นฐาน 74 คำสั่งและมีหน่วยความจำ 64 Kbyte

เดิม “อินเทล” (Intel) เป็นที่รู้จักกันเฉพาะในกลุ่มนักวิศวกรและนักเทคโนโลยี แต่หลังจากที่มีการโฆษณา “อินเทล อินไซด์” ในช่วงทศวรรษ 1990 “อินเทล” ก็เป็นที่รู้จักกันมากขึ้น และผลิตภัณฑ์ที่ทำให้ทุกคนรู้จักมาก “อินเทล” มากที่สุด คือ หน่วยประมวลผลกลางตระกูลเพนเทียม (CPU Pentium)

ไมโครโพรเซสเซอร์ (microprocessor) หมายถึง ชิปที่ใช้เป็นหน่วยประมวลผลกลางของเครื่องไมโครคอมพิวเตอร์ แบ่งได้ 2 ชนิด คือ

- RISC (Reduced Instruction Set Computer) คือ ไมโครโพรเซสเซอร์ที่มีคำสั่งน้อย แต่คำสั่งทำงานได้เร็ว

- CISC (Complex Instruction Set Computer) เป็นไมโครโพรเซสเซอร์ที่มีคำสั่งมากและซับซ้อน ได้แก่ ไมโครโพรเซสเซอร์ x86, Pentium และ Celeron ของ Intel และ ไมโครโพรเซสเซอร์จากบริษัทเอเอ็มดี (AMD)

ไมโครโพรเซสเซอร์ที่รู้จักกันดี ได้แก่ ยี่ห้อ Motorola 68030, 68040 ซึ่งใช้กับเครื่องแมคอินทอชรุ่นเก่า ส่วนที่ใช้กับเครื่องพีซี ได้แก่ Intel i486, Intel Pentium, Intel Celeron, AMD Athlon, AMD Sempron เป็นต้น
1972 : 8008 Microprocessor รุ่นที่พัฒนาต่อมา ใช้งานแบบ "TV typewriter" กับ dump terminal 8008: เป็นไมโครโปรเซสเซอร์ขนาด 8 bit มีหน่วยความจำ 16 Kbyte


1974 : 8080 Microprocessor รุ่นนี้เป็นการใช้งานแบบ Personal Computer รุ่นแรก ๆ
                   วิวัฒนาการของ INTEL CPU
 



                  รุ่น 8080 ในปี ค.ศ. 1974 Intel ผลิต 8080 เป็น microprocessor แบบ 8 บิทออกจำหน่าย ประกอบด้วย ทรานซิสเตอร์ ประมาณ 6,000 ตัว ใช้สัญญาณนาฬิกาที่ความถี่ 2 MHz Ed Roberts เจ้าของบริษัท Micro Instrumentation Telemetry systems ได้จัดชุดคิท (ผู้ซื้อประกอบเอง) เครื่องคอมพิวเตอร์ โดยใช้ 8080 และลงโฆษณาในวารสาร Popular Electronic โดยมีราคา $397 ใช้ชื่อว่า Altair มีการสั่งซื้อเป็นหลายพันเครื่อง ทั้งที่เครื่องต้องโปรแกรม ด้วย สวิตช์ และแสดงผลทาง LED เท่านั้น ถือเป็น ไมโครคอมพิวเตอร์เครื่องแรกๆ




 1978 : 8086-8088 Microprocessor หรือรุ่น XT ยังเป็นแบบ 8 bit เป็น PC ที่เริ่มใช้งานจริงจัง    
                     รุ่น 8086




ในปี ค.ศ. 1978 บริษัท Intel ได้ผลิต 8086-8088 Microprocessor ออกสู่ตลาด เป็น microprocessor ขนาด 8 บิทโดยบริษัท IBM นำมาใช้กับเครื่อง PC ในตระกูล IBM PC หรือที่รู้จักกันในนาม XT และ CPU ตัวนี้ก็เป็นต้นแบบของ CPU ในสถาปัตยกรรม X86 ที่ Intel หรือแม้บริษัทอื่น นำมาผลิต CPU ที่ใช้กับเครื่อง PC จนถึงปัจจุบันนี้ (ยกเว้นก็แต่ตัว Intel เอง ซึ่งผลิต CPU ขนาด 64 บิต ที่ไม่ใช้สถาปัตยกรรม X86) 8088, 8086 เป็น CPU ที่ประมวลผลทีละ 8 บิต มีชุดคำสั่ง 76 คำสั่ง ระบบปฏิบัติการที่สนับสนุน CPU ตัวนี้ก็คือ DOS อันเลื่องชื่อของไมโครซอฟท์ นั้นเอง1982 : 80286 Microprocessor หรือรุ่น AT 16 bit เริ่มเป็นคอมพิวเตอร์ที่ใช้งานแพร่หลายกันแล้ว




1982 : 80286 Microprocessor หรือรุ่น AT 16 bit เริ่มเป็นคอมพิวเตอร์ที่ใช้งานแพร่หลายกันแล้ว
                                    

                                       Intel 80286 (1982)


 ในปี ค.ศ. 1982 อินเทลก็ได้ผลิตซีพียูรุ่น 80286 ที่มีความเร็วเพียงแค่ 6 เมกิเฮิรตช์ ซึ่งบัสของ 80286 เป็นแบบ 16 บิต ภายในมีทรานซิลเตอร์บรรจุอยู่ประมาณ 130 , 000 ตัว จึงเป็นเหตุให้เกิด ความร้อนสูงในขณะทำงาน ดังนั้นจึงต้องมีการติดตั้งพัดลมและแผ่นระบายความร้อน ( Heat Sink )




  1985 : 80386 Microprocessor เริ่มเป็น CPU 32 bit และสามารถทำ   งาน   แบบ Multitasking ได้



1989 : 80486 Microprocessor เข้าสู่ยุคของการใช้จอสี และมีการติดตั้ง Math-Coprocessor ในตัว


                                        Intel 80386SX/80386DX (1985-1990)


Intel 80486SX/ 80486 DX (1989-1994)
ซีพียูรุ่น 80486 มีความเร็วตั้งแต่ 20 , 25 , และ 33 เมกะเฮิรตซ์ ทำงานแบบ 32 บิต และมีแคช ภายใน ( Intel Cache ) ทำสามารถทำงานได้เร็วกว่ารุ่น 80386 ที่จำนวนของสัญญาณนาฬิกา เท่ากัน โดยในรุ่น 80486 SX ยังไม่มี Math Coprocess รวมอยู่ในซีพียู ต่อมาทางอินเทลก็ได้ออกเครื่องรุ่น 80486 DX มีความเร็วตั้งแต่ 50 , 66 , 100 เมกะเฮิรตซ์ เป็นซีพียูที่มีขีดความสามารถสูงขึ้นทั้งด้านความเร็วในการคำนวณและเทคโนโลยีโดยการรวม เอา Math Coprocessor และ แคชมารวมอยู่ในชิปเดียวกันกับซีพียู


                                     INTEL PENTIUM




1993 : Pentium Processor ยุคแรกที่ Intel ใช้ชื่อว่า Pentium
  • อินเทลเพนเทียม Intel Pentium (1993-1998)
    ในช่วงแรกได้ผลิตออกมาที่ความเร็ว 60 และ66 เมกะเฮิรตซ์ อีกไม่นานนักอินเทลก็ได้ ผลิตความเร็วสูงขึ้นอีกเป็น 75 และ 90 เมกิเฮิรตซ์ ซึ่งมีสถาปัตยกรรมที่แตกต่างจากรุ่นแรกๆ และยังสามารถพัฒนาความเร็วไปได้อีกคือ 100 , 13 , 150 และ 166 เมกะเฮิรตซ์ เป็นซีพียูที่มีขีด ความสามารถสูงขั้นทั้งทางด้านความเร็วและเทคโนโลยี มีแคชภายในมากขึ้น และมี ความสามารถในการทำงานกับเลขทศนิยมได้ดีขึ้น และมีความสามารถในการทำงานกับเลข ทศนิยมได้ดีขึ้นโดยรุ่นแรกๆนั้นมีทรานซิสเตอร์ล้านกว่าตัว จึงทำให้มีความร้อนสูงมาก
                                                           
  •                                                             Pentium II
  • Pentium ll เป็นซีพียูที่ประกอบไปด้วยเทคโนโลยีของ Pentium Pro ผนวกเข้ากับเทคโนโลยี MMX ที่ใช้สถาปัตยกรรมการทำงานแบบใหม่ที่เรียกว่า “Single InstructionMultiple Data (SIMD)” ซึ่งได้มีการปรับโครงสร้างสถาปัตยกรรมภายในซิปถึง 70 จุด เพื่อเร่งความเร็วในการ ทำงานแบบ 64 บิต และยังมีการเพิ่มชุดคำสั่งเข้าไปอีก 70 คำสั่ง เพื่อเพิ่มประสิทธิภาพในการ ประมวลผลงานด้าน 3 มิติ
    1995 : Pentium Pro Processor สำหรับเครื่อง Server และ Work Station




1997 : Pentium II Processor ปัจจุบันยังพอมีคนใช้งานอยู่บ้าง                


                       เพนเทียมทูคลาเมธ Pentium II Klamath

  1. คือชิปรุ่นต่อมาซึ่งถูกพัฒนาความสามารถให้สูงขึ้น Pentium II Klamath เป็นชิปตัวแรก ในตลาด ที่เปลี่ยนจากอินเอตร์เฟซแบบซ็อกเกตมาเป็นสล็อตแทน ซีพียูเพนเทียมทูคลาเมธ มี ความเร็วเริ่มตั้งแต่ 233-300 MHz . ใช้เทคโนโลยีการผลิตขนาด 0.35 ไมครอน มีสถาปัตยกรรม แบบ SECC (Single Eade Contact Cartridge) ซึ่งมีลักษณะเป็นการ์ดที่ใช้กับ Slot 1 มีแคช ระดับสองติดตั้งอยู่บนการ์ดซีพียู ทำงานที่ความเร็วบัส 66 MHz ใช้ไฟเลี้ยง 2.0 โวลด์
  2. เพนเทียมทูเดสชู๊ตส์ ( Pentium II Deschutes )
    ซีพียูในรุ่นนี้เป็นการพัฒนาในส่วนของแกนซีพียูให้สามารถทำงานได้ที่ความเร็วสูงขึ้น โดย การลดขนาดการผลิตลงจาก 0.35 มาเป็น 0.25 ไมครอน และเนื่องจากการใช้เทคโนโลยีการ ผลิตที่เล็กลง ทำให้ลดการใช้ไฟเลี้ยงซีพียูน้อยลงอีกด้วย ซึ่งจะช่วยลดความร้อนบนแกนซีพียู
    เนื่องจากชิปแคชระดับสองที่ใช้กับซีพียูคลาเมธนั้น ถูกออกแบบให้สามารถรองรับการทำงานที่ความเร็วประมาณ 300 MHz เท่านั้น แต่ในการผลิตซีพียูในรุ่นเดสชู๊ตนี้ สามารถรองรับความเร็วได้ถึง 450 MHz ทำให้แคชระดับสองจะต้องทำงานที่ความเร็วสูงถึง 225 MHz
  3. 1998 : Pentium II Xeon(TM) Processor สำหรับ Server และ Work Station
  • 1999 : Celeron(TM) Processor สำหรับตลาดระดับล่างของ Intel ที่ตัดความสามารถบางส่วนออก
      
                                                                CELERON

ทางอินเทลได้นำเอาซีพียูเพนเทียมทูในรุ่นคลาเมธมาทำการตัดเอาส่วนของหน่วยความจำแคช ระดับสองออก เพื่อเป็นการลดต้นทุนการผลิตให้ต่ำลงทำให้ซีพียูเซเลอรอนมีสถาปัตยกรรม ภายในแบบเดียวกับเพนเทียมทู เพียงแต่ซีพียูเซลเลอรอนจะไม่มีหน่วยความจำแคชระดับสอง เท่านั้น การที่ Celeron สนันสนุน MMX การโอนถ่ายข้อมูลมัลติมีเดียได้ด้วยความเร็วสูง แต่ ความสามารถของมันก็ไม่ได้เร็วอย่างที่คาดไว้ เพราะ แคชที่มีเพียง 32 K กับบัส ที่ความเร็ว 66 MHz ก็ไม่ได้ช่วยอะไรมากนัก และให้ชื่อรหัสการพัฒนาในรุ่นนี้ว่าโควินตัน ( Covignton )
                          
                          เซลเลอรอนโควินตัน( Covington )
ซีพียูโควินตันจะมีด้วยกัน 2 รุ่นคือ รุ่นความเร็ว 266 และ 300 MHz ใช้เทคโนโลยีการ ผลิตขนาด 0.35 ไมครอน ส่วนของชิปจะถูกติดตั้งบนแผงวงจรขนาดเล็กที่เรียกว่า SECC ในเพ นเทียมทู แต่ในตระกูลเซลเลอรอนจะเรียกแผงวงจรดังกล่าวว่า SEPP (Single Edge Processor Packege) แทน ซึ่งจะใช้ติดตั้งบนเมนบอร์ดแบบ Slot 1 เช่นเดียวกัน และแผงวงจร SEPP ก็จะ ถูกบรรจุอยู่ในพลาสติกสีดำคล้ายตลับเกม


                        เซลเลอรอนเมนโดชิโน ( Mendocino )
ซีพียูในรุ่นนี้จีสถาปัตยกรรมแบบเดียวกับเพนเทียมทูรุ่นรหัส Deschutes คือใช้ เทคโนโลยีการผลิตขนาด 02.5 ไมครอน ซึ่งเป็นเทคโนโบยีการผลิตซีพียูที่มีขนาดเล็กกว่าเซล เลอรอนโควินตันที่ใช้ 0.35 ไมครอน และที่สำคัญยังด้เพิ่มส่วนของหน่วยความจำแคชระดับ สองเข้าไปบนตัวชิปซีพียูอีก 128 KB โดยแคชจะทำงานที่ความเร็วเดียวกับซีพียู จะเป็นว่า หน่วยความจำแคชระดับสองของเมนโดชิโนจะมีขนาดเล็กกว่าเพนเทียมทูซึ่งมีขนาด 512 KB แต่แคชระดับสองเมนโดชิโนจะทำงานเร็วกว่า แคชของเพนเทียมทู ซึ่งมีความเร็วเพียง ครึ่งหนึ่งของซีพียูเท่านั้น โดยซีพียูในรุ่นนี้จะเริ่มที่ความเร็ว 300 -433 MHz และถูกติดตั้งบน แผงวงจรขนาดเล็กที่เรียกว่า SEPP
ซีพียูเซลเลอรอน PPGA Socket 370
เพื่อเป็นการลดต้นทุนอินเทลจึงได้ออกแบบ PPGA ซึ่งมีต้นทุนที่ถูกกว่าแบบ Slot 1 สำหรับ ซีพียูเซลเลอรอนแบบ PPGA Socket 370 นี้ ยังคงมีสถาปัตยกรรมแบบเดียวกับเมนโดชิโนที่ใช้ เทคโนโลยีการผลิตขนาด 0.25 ไมครอน กับแคชระดับสองขนาด 128 KB ซึ่งทำงานที่ ความเร็วเดียวกับซีพียู มีความเร็วตั้งแต่ 300 – 533 MHz
  • 1999 : Pentium III Processor เป็นที่นิยมกันมากในช่วงนั้น
                  ซีพียูเพนเยมทรีแคทไม Pentium III Katmai

เป็นซีพียูที่มีความเร็วเริ่มต้นที่ 450 MHz ไปจนถึง 620 MHz ใช้เทคโนโลยีการผลิตขนาด0.25 ไมครอน มีทรานซิสเตอร์จำนวน 28 ล้านตัว ใช้สถาปัตยกรรมแบบ SECC 2 (Single Edge Contact Cartridge 2 )
  • 1999 : Pentium III Xeon(TM) Processor สำหรับ Server และ Work Station
        ซีพียูเพนเทียมทรีคอปเปอร์ไมน์ Pentuim III Coppermine
ใช้เทคโนโลยีการผลิตขนาด 0.18 ไมครอน มีทรานซิสเตอร์จำนวน 28 ล้านตัว ซีพียูมีแพ็คเกจแบบ SECC2 และลดขนาดของหน่วยความจำแคชระดับสองลงเหลือเพียงครึ่งหนึ่งคือ 256 KB แต่เป็น หน่วยความจำแคชที่สร้างบนชิปซีพียูซึ่งทำงานที่ความเร็วเดียวกับซีพียู เท่ากับว่าแคชของซีพียูคอปเปอร์ไมน์ทำงานเร็วเป็น 2 เท่า ของซีพียูแคทไม โดยหน่วยความจำแคชระดับสองนี้จะใช้ เทคโนโลยีใหม่ที่เรียกว่า Advanced Transfer Cache: ATC
  • 2001 : Pentium 4 Processor ที่ใช้งานอยู่ในปัจจุบัน
                                           Pentium 4
เพนเทียมโฟร์ Pentium 4 เป็นรุ่นที่ค่อนข้างจะมีความเร็วผิดจากที่คาดไว้ และมี Cache น้อย อย่างไรก็ดี ชิปชุดนี้ก็ได้รับการพัฒนาขึ้นอย่างมาก ไม่ว่าจะเป็นสถาปัตยกรรมการ ออกแบบที่ใหม่ทั้งหมด ระบบไปป์ไลน์ 20 ขั้น ต่อมาได้ชื่ออย่างไม่เป็นทางการว่า Intel Pentium Processor ที่จะมาแทนที่ Pentium III จะออกสู่ตลาดด้วยความเร็วเริ่มต้นที่ 1.4 GHz 1.5 GHz ภายใต้สถาปัตยกรรมใหม่ล่าสุดที่ชื่อ Intel NetBurst micro - architecture นอกจากนี้ ยังได้เพิ่มชุดคำสั่งใหม่ SSE 2 เข้าไปอีก 144 ชุดคำสั่ง
                  
                      เทคโนโลยีใหม่ที่พัฒนาขึ้นใน Pentium 4
1. Intel NetBurst micro – architecture เป็นสถาปัตยกรรมแบบใหม่ล่าสุดที่ช่วยให้สามารถ เร่งความเร็วของสัญญาณนาฬิกาให้ทำงานได้ที่ความถี่สูงๆ และเป็นจุดกำเนิดเทคโนโลยีใหม่ ๆอีก หลายอย่าง ที่ช่วยให้ Pentium 4 มีประสิทธิภาพมากขึ้น
2. Hyper Pipelined Technology เป็นเทคโนโลยีที่ช่วยให้ Pentium 4 สามารถทำงานตามคำสั่งซอฟต์แวร์ใน Pipeline ได้สูงถึง 20 ขั้นตอน รวมถึงการรองรับความเร็วสัญญาณนาฬิกาที่ความเร็ว 1.5 และ 1.4 GHz
3. Rapid Execution Engine เป็นเทคโนโลยีที่ทำให้ซีพียู Pentium 4 มีความเร็วของบัสระบบ สูงถึง 400 MHz ซึ่งจะช่วยให้ซีพียูสามารถรับส่งข้อมูลระหว่างซีพียูและอุปกรณ์อื่นๆเร็วขึ้น รวมถึงการรับส่งข้อมูลกับหน่วยความจำ Rambus ก็มีประสิทธิภาพขึ้นด้วย
4. Streaming SIMD Extensions 2 (SSE2) เป็นเทคโนโลยีชุดคำสั่งพิเศษที่พัฒนาต่อจาก SSE ซึ่งได้บรรจุคำสั่งใหม่เพิ่มเข้าไปอีก 144 คำสั่ง จากคำสั่งที่มีอยู่เดิมใน MMX และ SSE ซึ่ง ประกอบด้วยคำสั่งที่จัดการกับข้อมูลแบบจำนวนเต็มและทศนิยม อีกทั้งขยายขนาดของ SIMD Integer จากเดิม 64 บิต ที่ใช้กับเทคโนโลยี MMX มาเป็น 128 บิต ที่ทำให้เพิ่มประสิทธิภาพ อัตรากรรคำนวณสำหรับ SIMD Integer เป็น 2 เท่า
5. Execution Trace Cache เป็นตัวถอดรหัสเพื่อแปลความหมายของคำสั่งที่ได้รับจากแรม พร้อมกับจัดเก็บคำสั่งที่ผ่านการถอดรหัสเรียบร้อยแล้ว เมื่อใดก็ตามที่ซีพียูมีการเรียกคำสั่งบางคำสั่งที่ อาจซ้ำกับคำสั่งที่มีอยู่ใน Trace Cache ก็จะได้ไม่ต้องเสียเวลามาถอดรหัสซ้ำอีก
6. Advanced Trace Cache เป็นหน่วยความจำแคชระดับ 2 ขนาด 256 KB ที่ติดตั้งอยู่บน Die ของแผ่นซิลิกอน ที่ทำงานด้วยความเร็วเดียวกับซีพียู ซึ่งเทคโนโลยีนี้ใช้มาตั้งแต่ซีพียู Pentium III แล้ว แต่ได้ทากรขยายช่องทางการส่งข้อมูลระหว่างซีพียูกับแคชเพิ่มจากเดิมที่มีขนาด 64 ไบต์ ขณะที่ Pentium 4 มีขนาด 128 ไบต์ ทำให้มีการรับส่งข้อมูลได้สูงกว่ามาก
7. Advanced Dynamic Execution ซึ่งเรียกอีกอย่างหนึ่งว่า ‘Speculative Execution' ซึ่งเป็น กระบวนการทำงานคำสั่งใดๆ เสร็จเพียงครึ่งทางก่อน แล้วรอดูว่ามีคำสั่งไหนที่ต้องการใช้ใน ขั้นต่อไป โดย Pentium 4 สามารถมองเห็นคำสั่งได้ 126 คำสั่ง ในแต่ละเที่ยว และโหลดคำสั่ง ได้ 48 คำสั่ง และเก็บคำสั่งไว้ใน Pipeline ได้ 24 คำสั่ง ช่วยลดจำนวนโครงข่ายที่เป็นสาเหตุให้ เกิดการทำนายผิดพลาดลง 33 %
8. Enhanced Floating Point/ Multimedia ซีพียู Pentium 4 ได้ขยายส่วนของการคำนวณ Floating Point Register ให้กว้างถึง 128 บิต เพื่อให้การคำนวณเลขทศนิยมมีความรวดเร็วขึ้น ซึ่งจะทำให้สามารถทำงานกับโปรแกรมด้านมัลติมีเดียได้ดี
Pentuim 4 90 นาโนเมตร
เป็นโปรเซสเซอร์รุ่นใหม่ที่ใช้เทคโนโลยีการผลิตแบบ 90 นาโนเมตรเป็นเทคโนโลยีที่ทันสมัยที่สุดในวงอุตสาหกรรมเซมิคอนดักเตอร์ ที่อินเทลนำมาใช้เป็นพิเศษสำหรับผลิตชิปบน เวเฟอร์ ขนาด 300 มิลลิเมตร เทคโนโลยีการผลิตใหม่นี้ประกอบด้วยทรานซิลเตอร์ที่มีประสิทธิภาพสูงขึ้นและกินไปต่ำลง สเตรนซิลิคอน( strained silicon ) อินคอนเน็ค ความเร็วสูงที่ทำจากทองแดง( high – speed copper intercon - nects ) และวัสดุใหม่แบบ ( low – k dielectric ) ยังคงมีเทคโนโลยีไฮเปอร์ – เธรดดิ่ง ที่ช่วยการทำงานแบบมัลติทาสก์กิ้งอยู่เช่นเดิม และมี คุณสมบัติใหม่ๆเพิ่มเติม เช่น Enhanced Intel Micro-architecture แคช L2 มีขนาดใหญ่ขึ้นเป็น 1 เมกะไบต์ และมีชุดคำสั่งเพิ่มขึ้นอีก 13 ชุด โปรเซสเซอร์ของอินเทลรุ่นต่างๆ ที่มีเทคโนโลยี ไฮเปอร์ – เธรดดิ่ง


























 

 


 




 





 



 

 


 


กฎของมัวร์ (Moore's Law)


 หากกฎของมัวร์เป็นจริงคอมพิวเตอร์จากอดีตสู่ปัจจุบันจะก้าวไปอย่างไรในปี พ.ศ. 2490 วิลเลียมชอคเลย์และกลุ่มเพื่อนนักวิจัยที่สถาบัน เบลแล็ป ได้คิดค้นสิ่งที่สำคัญและเป็นประโยชน์ต่อชาวโลกมาก เป็นการเริ่มต้นก้าวเข้าสู่ยุคอิเล็กทรอนิคส์ที่เรียกว่า โซลิดสเตทเขาได้ตั้งชื่อสิ่งที ่ประดิษฐ์ขึ้นมาว่า "ทรานซิสเตอร์" แนวคิดในขณะนั้นต้องการควบคุมการไหลของกระแสไฟฟ้า ซึ่งสามารถทำได้ดีด้วยหลอดสูญญากาศแต่หลอดมี ขนาดใหญ่เทอะทะใช้กำลังงานไฟฟ้ามากทรานซิสเตอร์จึงเป็นอุปกรณ์ที่นำมาแทนหลอดสูญญากาศได้เป็นอย่างดีทำให้เกิดอุตสาหกรรมสาร กึ่งตัวนำตามมา และก้าวหน้าขึ้นเป็นลำดับ
พ.ศ. 2508 อุตสาหกรรมผลิตอุปกรณ์สารกึ่งตัวได้แพร่หลาย มีบริษัทผู้ผลิตทรานซิสเตอร์จำนวนมากการประยุกต์ใช้งานวงจรอิเล็กทรอนิกส์  กว้างขวางขึ้น มีการนำมาใช้ในเครื่องจักร อุปกรณ์ต่าง ๆ ตั้งแต่ของใช้ในบ้าน จึงถึงในโรงงานอุตสาหกรรม
กอร์ดอน มัวร์ (Gordon E. Moore)ผู้อำนวยการวิจัยและพัฒนาของบริษัทแฟร์ซายด์เซมิคอนดัคเตอร์เป็นผู้อยู่ในวงการวิจัยและพัฒนา ผลิตภัณฑ์ และการค้นคว้า ทางด้านสารกึ่งตัวนำ ต่อมาเขาได้เป็นผู้บุกเบิกและร่วมสร้างบริษัทอินเทลจนมีชื่อเสียงโด่งดังและประสบผลสำเร็จ การผลิตและการค้นคว้าทางด้านสารกึ่งตัวนำส่วนใหญ่ของแฟร์ซายด์จะอยู่ในการดำเนินการของมัวร์เขาได้คลุกคลีกับเทคโนโลยีมาอย่าง ต่อเนื่อง และยาวนานจากการสังเกตและคาด คะเน แนวโน้มทางเทคโนโนโลยีของมัวร์ในที่สุดเขาได้ตั้งกฎของมัวร์ (Moore's Law) จนเป็นที่ยอมรับ และทำให้การคาดคะเนอนาคตได้ใกล้เคียง ความเป็นจริง
 ทฤษฎีของมัวร์ได้กล่าวไว้ว่าความก้าวหน้าของเทคโนโลยีและความซับซ้อนของเทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอรืทำให้สามารถผลิต     ไอซีที่มี ความหนาแน่นไดด้เป็นสองเท่าทุก ๆ ช่วงระยะเวลาหนึ่ง เขาได้ทำการพล็อตกราฟแบบสเกลล็อกให้ดูจากอดีตและพบว่าเป็นเช่นนั้นจริง นอกจากนี้ความก้าวหน้าอื่น ๆ อีกหลายอย่างก็เป็นไปตามกฎของมัวร์ด้วยเช่นกัน
การสร้างทรานซิสเตอร์มีพัฒนาการมาอย่างต่อเนื่อง บริษัท แฟร์ซายด์ เซมิคอนดัคเตอร์เป็นบริษัทแรกที่เริ่มใช้เทคโนโลยีการผลิต ทรานซิสเตอร์แบบ    planar หรือเจือสารเข้าทางแนวราบ เทคโนโลยีนี้เป็นต้นแบบของการสร้างไอซีในเวลาต่อมา จากหลักฐานที่กล่าวอ้างไว้พบว่า บริษัทแฟร์ซายด์ได้ผลิตพลาน่าทรานซิสเตอร์ตั้งแต่ประมาณปี พ.ศ. 2502 และบริษัทเท็กซัสอินสตรูเมนต์ได้ผลิตไอซีได้ในเวลาต่อมา และกอร์ดอนมัวร์ก็ได้กล่าวไว้ว่า จุดเริ่มต้นของกฎของมัวร์เริ่มต้นจากการเริ่มมีพลาน่าทรานซิสเตอร์
ผู้เขียน : ยืน ภู่วรวรรณ
เรียบเรียงจาก : หนังสือไมโครคอมพิวเตอร์

                           
                                   กฎของมัวร์ (Moore’s Law)


                                       
กฎของมัวร์ (Moore’s law) อธิบายโดย กอร์ดอน มัวร์ (Gordon Moore) อดีตซีอีโอและผู้ร่วมก่อตั้งบริษัทอินเทลกล่าวถึง ปริมาณของทรานซิสเตอร์บนวงจรรวม จะเพิ่มเป็นเท่าตัวทุกสองปี

         กฎของมัวร์ (Moore's Law)

 หากกฎของมัวร์เป็นจริงคอมพิวเตอร์จากอดีตสู่ปัจจุบันจะก้าวไปอย่างไรในปี พ.ศ. 2490 วิลเลียมชอคเลย์และกลุ่มเพื่อนนักวิจัยที่สถาบัน เบลแล็ป ได้คิดค้นสิ่งที่สำคัญและเป็นประโยชน์ต่อชาวโลกมาก เป็นการเริ่มต้นก้าวเข้าสู่ยุคอิเล็กทรอนิคส์ที่เรียกว่า โซลิดสเตทเขาได้ตั้งชื่อสิ่งทีประดิษฐ์ขึ้นมาว่า "ทรานซิสเตอร์" แนวคิดในขณะนั้นต้องการควบคุมการไหลของกระแสไฟฟ้า ซึ่งสามารถทำได้ดีด้วยหลอดสูญญากาศแต่หลอดมี ขนาดใหญ่เทอะทะใช้กำลังงานไฟฟ้ามากทรานซิสเตอร์จึงเป็นอุปกรณ์ที่นำมาแทนหลอดสูญญากาศได้เป็นอย่างดีทำให้เกิดอุตสาหกรรมสาร กึ่งตัวนำตามมา และก้าวหน้าขึ้นเป็นลำดับ
พ.ศ. 2508 อุตสาหกรรมผลิตอุปกรณ์สารกึ่งตัวได้แพร่หลาย มีบริษัทผู้ผลิตทรานซิสเตอร์จำนวนมากการประยุกต์ใช้งานวงจรอิเล็กทรอนิกส์  กว้างขวางขึ้น มีการนำมาใช้ในเครื่องจักร อุปกรณ์ต่าง ๆ ตั้งแต่ของใช้ในบ้าน จึงถึงในโรงงานอุตสาหกรรม
กอร์ดอน มัวร์ (Gordon E. Moore)ผู้อำนวยการวิจัยและพัฒนาของบริษัทแฟร์ซายด์เซมิคอนดัคเตอร์เป็นผู้อยู่ในวงการวิจัยและพัฒนา ผลิตภัณฑ์ และการค้นคว้า ทางด้านสารกึ่งตัวนำ ต่อมาเขาได้เป็นผู้บุกเบิกและร่วมสร้างบริษัทอินเทลจนมีชื่อเสียงโด่งดังและประสบผลสำเร็จ การผลิตและการค้นคว้าทางด้านสารกึ่งตัวนำส่วนใหญ่ของแฟร์ซายด์จะอยู่ในการดำเนินการของมัวร์เขาได้คลุกคลีกับเทคโนโลยีมาอย่าง ต่อเนื่อง และยาวนานจากการสังเกตและคาด คะเน แนวโน้มทางเทคโนโนโลยีของมัวร์ในที่สุดเขาได้ตั้งกฎของมัวร์ (Moore's Law) จนเป็นที่ยอมรับ และทำให้การคาดคะเนอนาคตได้ใกล้เคียง ความเป็นจริง
 ทฤษฎีของมัวร์ได้กล่าวไว้ว่าความก้าวหน้าของเทคโนโลยีและความซับซ้อนของเทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอรืทำให้สามารถผลิต     ไอซีที่มี ความหนาแน่นไดด้เป็นสองเท่าทุก ๆ ช่วงระยะเวลาหนึ่ง เขาได้ทำการพล็อตกราฟแบบสเกลล็อกให้ดูจากอดีตและพบว่าเป็นเช่นนั้นจริง นอกจากนี้ความก้าวหน้าอื่น ๆ อีกหลายอย่างก็เป็นไปตามกฎของมัวร์ด้วยเช่นกัน
การสร้างทรานซิสเตอร์มีพัฒนาการมาอย่างต่อเนื่อง บริษัท แฟร์ซายด์ เซมิคอนดัคเตอร์เป็นบริษัทแรกที่เริ่มใช้เทคโนโลยีการผลิต ทรานซิสเตอร์แบบ    planar หรือเจือสารเข้าทางแนวราบ เทคโนโลยีนี้เป็นต้นแบบของการสร้างไอซีในเวลาต่อมา จากหลักฐานที่กล่าวอ้างไว้พบว่า บริษัทแฟร์ซายด์ได้ผลิตพลาน่าทรานซิสเตอร์ตั้งแต่ประมาณปี พ.ศ. 2502 และบริษัทเท็กซัสอินสตรูเมนต์ได้ผลิตไอซีได้ในเวลาต่อมา และกอร์ดอนมัวร์ก็ได้กล่าวไว้ว่า จุดเริ่มต้นของกฎของมัวร์เริ่มต้นจากการเริ่มมีพลาน่าทรานซิสเตอร์
กอร์ดอน มัวร์ เป็นผู้ร่วมก่อตั้งบริษัทอินเทล ได้ใช้หลักการสังเกตตั้งกฎของมัวร์ (Moore’s law) ขึ้น ซึ่งเขาบันทึกไว้ว่า ปริมาณของทรานซิสเตอร์บนวงจรรวม จะเพิ่มเป็นเท่าตัวทุกสองปี และมีผู้นำกฎนี้มาใช้กับ eCommerce ดังนี้
กำลัง (หรือ ความจุ หรือ ความเร็ว) ของสิ่งต่อไปนี้เพิ่มขึ้นสองเท่าทุกๆ 18 เดือน
1. ความเร็ว Computer Processor
2. แบนด์วิธการสื่อสารและโทรคมนาคม
3. หน่วยความจำของคอมพิวเตอร์
4. ความจุฮาร์ดดิสก์


            Moore's Law ตายแล้ว ทำไงดี GPUs ก็เกิด

สวัสดีครับ
   ท่านคงทราบกันดีนะครับ ว่ากฏของมัวร์ Moore's Law (Gordon Moore) ค้นพบในปี 1965 ได้กล่าวไว้ว่า ทุกๆ สิบแปดเดือนความเร็วของซีพียูจะเพิ่มขึ้นเป็นสองเท่า  นั่นคือหากท่านซื้อคอมพิวเตอร์ที่มีซีพียูล่าสุดวันนี้ อีกหนึ่งปีครึ่งถัดไป คุณไปซื้อซีพียูตัวใหม่หรือว่าซื้อคอมตัวใหม่ คุณจะได้ซีพียูที่แรงกว่าเดิมสองเท่า สะใจกว่าสองเท่าครับ (อ่านเพิ่มเติมได้ที่ http://www.firstmonday.org/issues/issue7_11/tuomi/)
   แต่นั่นมันเป็นอดีตไปแล้วครับ เพราะว่ากฏนี้ไม่ได้เป็นจริงแล้วในวันนี้ และกฏนี้ได้ตายไปตั้งแต่ปี 2003 ก็เพราะว่าซีพียูไม่สามารถที่จะอัดตัวทรานซิสเตอร์เข้าไปได้อีกเหมือนเมื่อก่อน
  ดังนั้นเทคโนโลยีใหม่ตอนนี้ที่เกิดก็คือ การเกิดคอร์คู่ คอร์แฝด สองคอร์ สี่คอร์ แปดคอร์ ขึ้นมานะครับ ที่ว่าดูโอ้ คอร์ (Duo Core) นะครับ นั่นคือ อัดจำนวนซีพียูเพิ่มเข้าไปแทน ในคอมพิวเตอร์ อยู่ที่ว่าบริษัทไหนจะอัดเข้าไปได้เท่าไหร่ในเมนบอร์ด
  สำหรับการคำนวณหล่ะครับ มันจะแรงขึ้นเร็วกว่าจริงหรือ แล้วจะจัดการให้มันคำนวณอย่างไรให้ทำงานได้เต็มประสิทธิภาพเวลามีสองคอร์ นั่นคือ ระบบปฏิบัติการมันก็ต้องมีหน้าที่ในการแจกจ่ายงานให้ไปทำเพื่อแบ่งเบาภาระงานกันครับ
  แล้วสำหรับคนเขียนโปรแกรมเองหล่ะครับ หากเขียนโปรแกรมอยู่ที่เป็นแบบวิ่งบนหนึ่งคอร์ ซีพียูตัวเดียวแล้วมันจะวิ่งบนสองตัวต้องทำอย่างไร อันนี้ต้องจัดการด้วยการเขียนด้วยภาษาที่สามารถจะสั่งให้มันทำงานคำนวณในเชิงขนาน Parallel computing ให้ได้เพื่อจะได้ใช้ศักยภาพของคอร์ที่มีอยู่ทั้งสอง
  แล้วมีการจัดการหรือคิดเทคโนโลยีไรมาทดแทนหรือประยุกต์ใช้ หรือมีทางเลือกอื่นอีกไหม
  ทางเลือกหนึ่งก็คือ เทคโนโลยีของการ์ดจอ Graphic card ที่ทำหน้าที่ในการประมวลผลก่อนส่งภาพออกหน้าจอนั้นได้มีการพัฒนามาตั้งแต่ปี 1998 แล้วพัฒนามาเรื่อยๆ ให้มีศักยภาพขึ้นเรื่อยๆ จนมาพัฒนาหนักเอาปี 2003 ที่ชดเชยการจากไปของมัวร์ลอว์ แต่การเขียนโปรแกรมนั้นไม่ใช่จะง่ายนักเพราะต้องผ่านการเขียนเพื่อจัดการส่งงานไปคำนวณบนการ์ดจอแทนจะคำนวณบนซีพียู ก่อนที่ สองคอร์ จะออกมานะครับ
  มาดูตัว GPUs (Graphics Processing Units) มันคืออะไร จีพียูมันคือหน่วยประมวลผลกราฟิกส์ บนการ์ดจอนั่นเองที่จะทำหน้าที่คำนวณพวกสีต่างๆก่อนที่จะวาดแล้วส่งออกหน้าจอ ข้อดีของการ์ดจอสมัยนี้คือว่า มันจะมีจำนวนหน่วยประมวลผล GPUs พวกนี้หลายๆ ตัว อย่างน้อย ก็ 20 ตัวขึ้นไป แล้วแต่รุ่นและยี่ห้อ ที่จะมาแรงหน่อยก็คือ Nvidia รองๆลงไปก็พวก ATI อันนี้ก็แล้วแต่ว่าใครออกรุ่นใหม่มาก่อนกันครับ คราวนี้การคำนวณบนการ์ดจอนี้ ผู้ใช้จะต้องเขียนโปรแกรมเพื่อส่งไปคำนวณบนการ์ดจอ ที่สอดรับกับโปรแกรมนั้นๆ เพื่อจะให้สามารถแสดงผลที่หน้าจอ แบบหมุนแล้วโดนใจวัยรุ่น แบบทันทีทันควัน โดยซีพียูจะทำหน้าที่ในการจัดงานแบบภาพรวม แล้วส่งสิ่งอำนวยความสะดวกและข้อมูลส่งไปให้ GPUs ในการประมวลผลแล้วส่งออกทางจอภาพ ซึ่งการคำนวณบนการ์ดจอพวกนี้จะมีความเร็วมากขึ้นกว่าคำนวณบน ซีพียูเพียงตัวเดียว
   GPUs ก็ยังไม่ชนเพดานของความเร็วในตอนนี้ เพื่อให้สนองต่อกิเลสของมนุษย์ที่ไม่หยุดยั้งกับเทคโนโลยี ผู้ออกแบบก็หาหนทางในการซื้อการ์ดจอเสียบเข้าไปได้หลายๆ ตัว ต่อไปคงมีออกมาให้เห็นกันอีกครับ แต่การเขียนโปรแกรมตอนนี้ก็มีหลายๆ ภาษาที่ออกมาเอื้ออำนวยความสะดวกเพื่อจะให้คำนวณบน GPUs ได้ เช่น ภาษา Cg, Brook, Sh และหลายๆตัว
   สำหรับโปรแกรมที่เขียนด้วยภาษาเหล่านี้ หรือไลบรารี่ด้วยโปรแกรมเหล่านี้จะต้องทำงานบนเครื่องที่มีการ์ดจอสนับสนุนโปรแกรมนั้นถึงจะรันโปรแกรมได้อย่างมีประสิทธิภาพ
   ซึ่งจริงๆ แล้วการ์ดจอจะทำหน้าที่ในการเก็บคุณสมบัติของข้อมูลก่อนจะทำการคำนวณเพื่อส่งออกหน้าจอในการแสดงผล แต่มีทางออกที่จะสามารถส่งข้อมูลจากแรมไปอัดใส่ไว้ในแรมของการ์ดจอแทนที่จะจัดการและบริหารในการคำนวณบนการ์ดจอ ในเชิงขนานได้ทำให้ศักยภาพในการคำนวณเร็วมากขึ้น
   อันนี้นับว่าเป็นเทคโนโลยีใหม่ในทางการบริหารจัดการความรู้เช่นกันครับ สำหรับงานทางคอมพิวเตอร์
ลองอ่านข้อมูลเพิ่มเติมได้ที่ Nvidia ครับ http://developer.nvidia.com/object/cg_tutorial_home.html
ใครมีเครื่องแรงๆ ก็ลองดูนะครับ เผื่อว่าจะได้ใช้ให้คุ้มค่าสำหรับงานทางกราฟิกนะครับ
แต่ว่าการ์ดจอที่ว่าตอนนี้ยังแพงอยู่ครับ ตัวแพงๆ ล่าสุด ก็คงซื้อโนทบุคได้ซักตัวครับ ราคาเท่ากับการ์ดจอหนึ่งใบ โนทบุคแรงๆ ที่ใช้ RAM 512 Mb ก็คงราคาเหยียบหนึ่งแสนบาทครับ แต่คิดว่าเมื่อตัวใหม่ๆ ออกมาก็จะถูกลงครับ
ขอบคุณมากครับผม
สมพร ช่วยอารีย์

การแทนข้อมูลชื่อและนามสกุลด้วยรหัสASCLL

 การแทนข้อมูลชื่อและนามสกุลภาษาอังกฤษ
 ด้วยรหัส ASCLL
ใช้พื่นที่จัดเก็บ 13 ไบต์
รหัส ASCLL  ประกอบด้วย
PALITA LEKKUL
P   =  0101 0000           แปลงค่าเป็นฐานสิบหก       =     ( 50 )
A   =  0100 0001           แปลงค่าเป็นฐานสิบหก      =     (  41 )
L   =   0100 1100          แปลงค่าเป็นฐานสิบหก       =     ( 4C )
I    =   0100  1001         แปลงค่าเป็นฐานสิบหก       =     ( 49 )
T   =   0101 0100          แปลงค่าเป็นฐานสิบหก       =     ( 54 )
A   =   0100 0001          แปลงค่าเป็นฐานสิบหก      =      ( 41 )

L    =  0100 1100          แปลงค่าเป็นฐานสิบหก        =    ( 4C )
E    =  0100 0101          แปลงค่าเป็นฐานสิบหก        =    ( 45 )
K   =   0100 1011         แปลงค่าเป็นฐานสิบหก        =    ( 4B  )
K   =   0100 1011         แปลงค่าเป็นฐานสิบหก        =     ( 4B )
U   =   0101 0101         แปลงค่าเป็นฐานสิบหก        =     ( 55 )
L    =   0100 1100        แปลงค่าเป็นฐานสิบหก        =      ( 4C )