SlideShare ist ein Scribd-Unternehmen logo
1 von 63
OVERVIEW DRAM
GVHD: ThS. Cao Trần Bảo Thương
Sinh viên thực hiện : Nguyễn Nhật Quang 1020169
Mã Thanh Tuyền 1020261
Nội Dung
• Cấu tạo và hoạt động Dram cơ bản
• Sự phát triển của kiến trúc Dram
• Các tiêu chuẩn trong DRAM ngày nay
• FB-DIMM
• Nói ngắn gọn về các vấn đề của hệ thống DRAM
Cấu tạo và hoạt động Dram cơ bản
Một bộ nhớ truy cập
ngẫu nhiên (RAM)
mà sử dụng một
transitor và một tụ
duy nhất cho mỗi bit
được gọi là bộ nhớ
truy cập ngẫu nhiên
động hoặc DRAM
Tổ chức cơ bản của DRAM internals.
Memory Controller truy
xuất từng Cell riêng biệt
bằng cách xác định giao
của dòng và cột
Những Memory Array trong Memory chip làm việc theo nhiều
cách
• Đồng thời
• Độc lập
• Nơi này và nơi khác
Khi memory array được thiết kế hoạt động theo cách union ,
nó hoạt động như là một đơn vị. Số bit dữ liệu truyền và nhận
bằng số dãy của DRAM mỗi lần Memory Controller truy suất
vào nó.
Ví dụ
4 array mỗi dãy đọc 1 bit data
mỗi lần. Mỗi lần khi memory
controller yêu cầu, 4 bit dữ liệu
được gửi ra và nó được đọc ở
mỗi cột
bank
Nhiều bank hoạt động độc lập => DRAM
Đan xen nhiều bank đạt đươc tốc độ dữ liệu cao hơn
Ví dụ:
Nếu một DRAM bank có thể sản xuất một đoạn mới của dữ
liệu mỗi 10 ns, nó có thể chuyển đổi qua lại giữa hai bank để
sản xuất một đoạn mới mỗi 5 ns, hoặc luân chuyển giữa bốn
bank để sản xuất một đoạn mới mỗi 2.5 ns, do đó tốc độ dữ
liệu tăng gấp đôi hoặc gấp bốn lần có thể đạt được bởi bất
kỳ bank nào.
Một hệ thống cũng có nhiều DIMM , nó cũng được coi như là
những bank hoạt động độc lập. Người ta dung “rank” để phân biệt
DIMM hoạt động độc lập vs các bank nội hoạt động độc lập
Các cấp tổ chức của một hệ thống Dram
Tổ chức bus bộ nhớ
JEDEC-style organization
• Data: truyền dữ liệu đi và
đến từ Dram
• Address: Mang địa chỉ
dòng và cột đến Dram
• Control: Cho phép ngõ
ra của hàng và cột
• Chip-select: cho phép
đợi yêu cầu của bộ nhớ
Tổ chức hệ thống và các bước hoạt động đọc
Dram
Sự phát triển của kiến trúc Dram
Sự thay đổi cấu trúc vì mục tiêu thông lượng
Clocked DRAM
- Là những Dram đầu tiên được điều khiển bởi tín hiệu
clock nội
The conventional Asynchoronous DRAM
- Yêu cầu mỗi truy suất phải đi qua tất cả các bước được mô
tả trước đó
- Với mỗi lần truy suất : Bitline được sạc sẵn, kích hoạt row,
đọc column sau khi kích hoạt row
- Khi Column được đọc xong, row bị vô hiệu hoá hoặc đóng
và bitline được nạp lại.
- Theo quy ước và thiết kế mạch RAS và CAS phải tang
đồng loạt
Ví dụ:
Sự thay đổi cấu trúc vì mục tiêu thông lượng
Sự thay đổi cấu trúc vì mục tiêu thông lượng
Fast Page Mode DRAM (FPM
DRAM)
- Địa chỉ hàng được tổ chức
liên tục nên bộ cảm biến có
thể đọc dữ liệu từ nhiều cột
- Tạo ra bộ nhớ cache của các
data đầu ra hoạt động trong
cảm biến => Tạo thành một
“open page” có thể truy cập
nhanh chóng
- => Tăng tốc độ truy cập liên
tiếp đến cùng một hàng
Sự thay đổi cấu trúc vì mục tiêu thông lượng
Extended Data-Out DRAM
(EDO DRAM)
- EDO DRAM (hyper-page mode
DRAM) là FPM DRAM thêm
một vài transistor vào output để
tạo ra một chốt giữa cảm biến và
output của DRAM
- Chốt này giữ các trạng thái tại
output pin, cho phép CAS
deassert nhanh chóng, memory
array sạc sớm hơn
=> EDO DRAM hoạt động
nhanh hơn FPM DRAM
Sự thay đổi cấu trúc vì mục tiêu thông lượng
Burst-Mode EDO DRAM (BEDO
DRAM)
- BEDO được xây dựng trên EDO bằng
cách thêm các khái niệm về “bursting"
các khối dữ liệu liền kề nhau từ một
hàng đã kích hoạt mỗi khi một địa chỉ
cột mới được gửi đến các chip DRAM
- Thêm vào một bộ đếm nội, đầu tiên là
nhận địa chỉ tới và sau đó tự động tăng
giá trị địa chỉ cột mỗi lần chuyển đổi
CAS, và DRAM gửi tuần tự dữ liệu cột
tiếp theo vào bus.
- Nhanh hơn EDO vì địa chỉ cột được
điều khiển bằng tín hiệu nội
Sự thay đổi cấu trúc vì mục tiêu thông lượng
Synchronous DRAM (SDRAM)
- Bằng cách kết hợp tất cả các dữ
liệu và điều khiển truyền nhận
với một tín hiệu clock, thời gian
diển ra các sự kiện dễ dự đoán
và chương trình ít nghiêng tức
là hệ thống có khả năng đạt
được vòng quay nhanh hơn trên
các yêu cầu, do đó hiệu suất
thông lượng cao hơn.
Sự thay đổi cấu trúc vì mục tiêu thông lượng
Synchronous DRAM (SDRAM)
- Giống như BEDO DRAM,
SDRAM hỗ trợ khái niệm về burst
mode. SDRAM có programmable
register chứa một burst length.
Nhờ đó DRAM xác định có bao
nhiêu cột đưa ra output trên các
chu kỳ liên tiếp => loại bỏ các tín
hiệu timing như là chuyển đổi qua
lại của CAS , làm giảm băng thông
sử dụng lệnh
Sự thay đổi giao diện vì mục tiêu thông lượng
Rambus DRAM (RDRAM , Concurrent RDRAM, Direct
RDRAM)
RDRAM:
- Sử dụng đường bus hẹp đáng kể so với bus truyền thống.
- Các tín hiệu bus Address, control, data và chip select đi trên
cùng một dây nhưng ở không đồng thời.
- Bus RDRAM rộng 1 byte, tần số 250Mhz, truyền dữ liệu trên
cả hai cạnh xung clock để đạt được băng thông lý tưởng là
500 MB/s
- Các giao dịch trên bus sử dụng một giao thức phân chia yêu
cầu / đáp ứng
Sự thay đổi giao diện vì mục tiêu thông lượng
RDRAM:
Vd:
- Đầu tiên gói address/control được đưa vào gồm toàn bộ địa
chỉ hàng và địa chỉ cột, và sau đó dữ liệu được đưa vào.
- Các giao dịch khác nhau có thể yêu cầu số chu kỳ giao dịch
khác nhau, tùy thuộc vào: loại giao dịch, vị trí của dữ liệu
trong thiết bị, số các thiết bị trên một kênh
Sự thay đổi giao diện vì mục tiêu thông lượng
Concurrent RDRAM:
- Bus được chia thành các phân đoạn riêng biệt: address,
command và data giống như tổ chức Dram JEDEC style
- Data segment rộng 1byte được thêm một 1bit address
segment và 1bit control segment.Như thế bus có 3 phân
đoạn riêng biệt có thể hành động đồng thời và riêng biệt .
=> Đơn giản hoá giao dịch, tăng hiệu quả làm việc của RDRAM
Sự thay đổi giao diện vì mục tiêu thông lượng
Direct RDRAM:
- Tăng độ rộng data segment đến 2 byte, address segment 5
bit, và control segment 3 bit => Tăng thông lượng dữ liệu
trên kênh
- Tốc độ hoạt động Rdram gấp đôi so với tốc độ ban đầu , đạt
500Mhz trong những năm gần đây.
- Thêm bộ đệm nửa hàng giữa các bank lân cận => giảm chi
phí
Sự thay đổi giao diện vì mục tiêu thông lượng
DDR SDRAM - Double Data Rate
DRAM
- DDR tăng gấp đôi băng thông dữ
liệu của SDRAM bằng cách truyền
dữ liệu ở cả hai cạnh của clock
- DDR SDRAM tương tự với
SDRAM: cùng công nghệ truyền
tín hiệu, giao diện đặc tính kĩ
thuật, các chân ngõ ra trên DIMM
- DDR SDRAM truyền nhận bên
trong từ cácd dãy SDRAM tương ,
đọc và ghi 2 lần số bit như SDRAM
Sự thay đổi cấu trúc về mục tiêu độ trễ
Virtual Channel Memory (VCDRAM)
- Thêm vào bộ nhớ cache SRAM đáng kể để đệm khối dữ
liệu lớn. Bộ nhớ cache này được quản lý bởi memory
controller .
- Một hàng kích hoạt du chuyển cả 1 trang dữ liệu vào
cảm biến . Hoạt động “Prefetch” and “restore” di chuyển
dữ liệu giữa cảm biến và các phân đoạn cache SDAM
cùng thời điểm.Hoạt động cột đọc hoặc ghi di chuyển
cột dữ liệu giữa phân đoạn cache và bộ đệm đầu ra
Sự thay đổi cấu trúc về mục tiêu độ trễ
Enhanced SDRAM (ESDRAM)
- Như EDO DRAM, ESDRAM thêm một chốt SRAM vào
trong lõi DRAM, trong khi EDO thêm các chốt sau cột
MUX , ESDRAM thêm nó trước khi cột MUX . Do đó,
các chốt rộng như một trang DRAM.
- Điều này cho phép chồng chéo trong hoạt động
- Cơ chế ghi xung quanh trong đó có thể bắt đầu ghi mà
không cần đóng hàng đang hoạt động
Sự thay đổi cấu trúc về mục tiêu độ trễ
MoSys 1T-SRAM
- Được tạo thành bằng việc bọc xung quanh một lõi
DRAM tốc độ cao bởi một SRAM interface
- Lõi DRAM gồm một số lượng rất lớn các bank, giảm
kích thước của một bank làm cho thời gian truy cập
nhanh hơn nhưng tăng số lượng bank, mạch điều
khiển phức tạp và tốn chi phí và giảm hiệu quả
- DRAM có độ trễ thấp nhất , thích hợp với các hệ thống
nhúng tốc độ cao và các hệ thống game.
Sự thay đổi cấu trúc về mục tiêu độ trễ
Reduced Latency DRAM (RLDRAM)
- Lõi DRAM nhanh mà không có đặc điểm kỹ thuật của
DIMM , sử dụng trong môi trường điều khiển bộ nhớ
trực tiếp.
- Giao diện trực iếp đến chip làm giảm clock skew, do đó
tăng một phần tốc độ của interface
Sự thay đổi sự thay đổi cấu trúc về mục tiêu độ trễ
Fast Cycle DRAM (FCRAM)
- FCRAM đạt độ trễ thấp truy cập dữ liệu bằng cách phân
chia các mảng dữ liệu thành các mảng con giống như
việc kích thước của mảng
- Mảng dữ liệu con được quy định bằng cách thêm bit
vào địa chỉ hàng, do đó cơ chế chủ yếu là đưa một phần
của địa chỉ cột vào hàng được kích hoạt.
- Chỉ một trong số các mảng con được điều khiển trong
khi một hàng được kích hoạt.
- Có băng thông cao nhất của DIMM .
JEDEC’s SDRAM Technology
 JEDEC: Joint Electron Device Engineer-ing Council
 JEDEC SDRAMs use the traditional DRAM- system
Organization
 Có 4 loại đường bus, sử dụng riêng biệt cho từng chức
năng. Bao gồm: (1) data, (2) address, (3) control, và (4)
chip-select busses. Các đường bus này còn được gọi là
“memory bus”.
 Data bus là bus tương đối rộng. Độ rộng càng lớn thì
hiệu suất của hệ thống càng cao.
 Address bus có độ rộng phụ thuộc vào số bit lưu trữ
trong Ram. Độ rộng tiêu biểu của loại bus này là 15 bits.
 Control bus: bao gồm tín hiệu row, columm, output
enable, và các tín hiệu có tính chất tương tự
 Chip select bus: là tín hiệu suy nhất điều khiển dãy
Ram trong hệ thống. Với mục đích cho phép dãy Ram
đọc lệnh và thực hiện chúng.
 Một điểm mới có trên SDRAM mà công nghệ DRAM cũ
không có là sự tích hợp system clock.
Single Data Rate SDRAM
Sử dụng single-edged clock để đồng bộ tất cả các tín hiệu.
SDRAM có mốt số tính năng mà các thế hệ DRAM trước đó chưa
có là: Programmable burst length và Programmable CAS
lantency
 Programmable burst length: Giá trị Burst length được thiết lập
từ tước và lưu trữ vào một thanh ghi. SDRAM mỗi khi nhận được
row address hay column address thì sẽ thực hiện quá trình
đọc/ghi burst với giá trị burst đã được lưu từ trước. Nhờ vậy mà
quá trình đọc/ghi có thể cải thiện tốc độ thêm một bước nữa.
 Programmable CAS latency: Tương tự như Burst length, giá trị
của CAS latency cũng có thể lập trình và được lưu vào một thanh
ghi trên SDRAM.
Double Data Rate SDRAM
DDR SDRAM có mốt số tính năng mà SDR DRAM không có là:
Dual-Edged Clocking và Onchip Delay-locked loop
 Dual-Edged Clocking: Trong DDR SDRAM quá trình trao đổi
data sử dụng dual-edged clock.
Single-edged clock & Dual-Edged Clock
 On-Chip Delay-Locked Loop: Mạch DLL đảm bảo cho data
truyền đi được đồng bộ với tín hiệu clock của memory controller.
Vì thế data có thể đến memory controller đúng lúc. Memory
controller điển hình có 2 nguồn clock : một được đồng bộ với
xung clock chính, và một được delay 90 𝑜 dùng để lấy mãu data
đến từ Ram.
PLL (Phase locked loop) sử dụng mạch điều chế để tạo ra tín
hiệu xung mới có thể đồng bộ với các tín hiệu khác.
DDR SDRAM without a DLL
DDR SDRAM with a DLL
Rambus in Particular
• Trong hệ thống Rambus thì tất cả các data, address,
command, tín hiệu chip-select được truyền trên cùng
một đường Bus. Vào từng thời điểm khác nhau trên
đường Bus thì thông tin truyền trên đó là không giống
nhau. Đây là lý do tại sao hệ thống chứa Rambus còn
được gọi là “Multiplexed”
• Mặt khác, một hệ thống Rambus sử dụng đường bus vật
lý khá khiêm tốn, nó có thể nhỏ hơn rất nhiều so với
đường bus trên hệ thống thông thường khác.
Do đó, phiên truyền tín hiệu trên hệ thống Rambus lúc
nào cũng cần nhiều chu kỳ bus hơn so với hệ thống
JEDEC truyền thống.
Để thực hiện được điều trên thì một hệ thống Rambus cần
phải có:
• Bộ memory controller (bus master) có khả năng đóng gói
các thông tin để truyền đi
• Các khối DRAM có khả năng giải mã gói tin và nhận biết
xem gói tin đó có được gửi đến cho mình không.
Mặc dù tất cả các hoạt động của DRAM vẫn dựa trên sự điều
khiển của memory controller, nhưng với khả năng tự nhận
biết các gói tin nên các DRAM trên hệ thống Rambus vẫn
được gọi là các thiết bị bán thông minh.
Low-Skew Clock Using Variable Delay Circuits
Có 2 tín hiệu clock được đưa vào mỗi DRAM device, và độ dài
đường đi của mỗi tín hiệu clock là tương thích, Skew Clock của hệ
thống được hạn chế bằng cách lấy giá trị trung bình của 2 tín hiệu
clock input để được giá trị điểm giữa hoặc điểm đảo chiều clock.
Variable Request Lantency
Là 1 cơ chế cho phép Memory controller xác định khoảng thời gian
DRAM phải đợi trước khi handling request. Đặc tính của cơ chế này
được mô tả bởi 2 giai đoạn.
 Thanh ghi Access-time lưu giá trị delay . DRAM dựa vào giá trị này
để biết phải đợi trong bao nhiêu chu kỳ trước khi thực hiện trao đổi
dữ liệu.
 DRAM xác định khoảng delay cho quá trình responding request
Tầm quan trọng của variable request latencies trong hệ thống Rambus
Variable Block size
Là cơ chế cho phép memory controller có thể xác định lượng data
sẽ được truyền. Giá trị này được memory controller gửi đi trong 1
request packet và được gọi là BlockSize field. Giá trị này có thể giao
động từ 0 byte tới 1024 bytes.
Cơ chế này cho phép có thể sử dụng Rambus trong nhiều mục
đích thiết lập khác nhau, và đảm bảo hệ thống Rambus hoạt động
hết hiệu năng của nó.
Running the Clock at the Data rate
Vấn đề về phân bổ clock trong hệ thống được khắc phục bằng cách sử
dụng 1 xung clock riêng cho đường bus. Và xung này có giá trị tần số
bằng 1 nửa so với tần số của bus cycle.
SO SÁNH CÔNG NGHỆ JEDEC VÀ RAMBUS
Programmable CAS Latency
 JEDEC: Cho phép các hãng sản xuất thay đổi thông số này để tối ưu
hóa hiệu năng của hệ thống. Thông số này được lập trình vào lúc khởi
động hệ thống, và theo như những người thiết kế thì sẽ không được
thay đổi trong suốt quá trình hệ thống đang hoạt động.
 Rambus: Latency được thiết lập ở mỗi lần bộ xử lý gửi một request tới
cho DRAM, nhưng cách này cho phép mỗi thanh ghi được truy vấn có
thể lưu 2 hay nhiều hơn loại dữ liệu mà dùng các phương thức truyền
khác nhau. Hệ thống sử dụng Rambus có thể thay đổi Latency theo
từng request một. Và thông số này cho phép lập trình nhiều giá trị độ
trễ khác nhau. Điều này có thể không cần thiết với hệ thống JEDEC
nhưng là bắt buộc đối với hệ thống Rambus.
Programmable Burst Length
 JEDEC: Cho phép các hãng sản xuất thay đổi thông số này để tối ưu
hóa hiệu năng của hệ thống. Thông số này được thiết lập lúc khởi
động hệ thống, và sẽ không được thay đổi trong suốt quá trình hệ
thống đang hoạt động.
 Rambus: Block size được lập trình lại mỗi lần bộ xử lý gửi một request
cho DRAM. Một hệ thống JEDEC có thể hoạt động hiệu quả nếu mỗi
cột dữ liệu read / write được đính kèm với một tín hiệu CAS. Nhưng
hệ thống Rambus không làm được điều này, vì với một lệnh thì sẽ tiêu
tốn thêm một nửa chu kì bus.
Dual-Edged Clocking
 JEDEC: Tín hiệu định thời là một xung clock trong được sinh ra bởi
xung clock của hệ thống và DQS data strobe. Dữ liệu được chốt nhờ
các cạnh của xung clock hệ thống
 Rambus: Tín hiệu định thời được tổng hợp từ nguồn clock nội mà
không đồng bộ với bất kì tín hiệu nguồn nào trong hệ thống. Tín hiệu
này được sinh ra từ 2 pha khác nhau của xung clock global (U-
shaped). Ngược lại với cơ chế clock DDR, cơ chế clock của Rambus
không trùng với pha nào của xung clock hệ thống, cả theo cạnh hay
điểm giữa của xung clock. Hơn nữa là có độ trễ giữa tín hiệu data out
và xung clock global trong khi công nghệ DDR SDRAM thì hướng đến
sự đồng pha.
On-Chip PLL/DLL
 JEDEC: Sử dụng on-chip DDL để đảm bảo dữ liệu đang được ghi vào
data bus đồng pha với clock global. Bộ DDL làm điều này bằng cách
delay tín hiệu phản hồi của DRAM đối với request đọc đủ lâu để dữ
liệu được ghi vào ngay lúc DRAM thấy được cạnh của xung clock tiếp
theo.
 Rambus: Sử dụng một mạch on-chip Variable Delay để đảm bảo rằng
mỗi DRAM trong hệ thống và memory controller có sự đồng bộ về
clock. Mạch delay làm điều này bằng cách tìm điểm giữa của 2 pha
trên cùng một tín hiệu và để tạo ra một xung clock tổng hợp, không
đồng bộ với bất kì xung clock nào khác trong hệ thống. Quá trình này
phức tạp hơn DLL thông thường nên mạch Variable Delay của
Rambus cũng phức tạp hơn mạch DLL thông thường.
CÁC CÔNG NGHỆ KHÁC
Programmable CAS Latency
 Sự có mặt của Programmable CAS Latency trong DRAM giúp cho
thành phần chạy nhanh có thể mô phỏng được tiến trình của phần
chậm, nhờ đó người ta có thể kết hợp nhiều thành phần thuộc nhiều
thế hệ khác nhau ( với tốc độ khác nhau ) trong cùng một hệ thống,
hoặc các thành phần cùng thế hệ nhưng khác hãng sản xuất ( hiệu
năng có thể khác biệt đôi chút do công nghệ sản xuất ) trong cùng một
thanh RAM.
 Use fixed CAS latency parts
 Explicitly identify the CAS latency in the read or write command
 Program CAS latency by using fuses on the DRAM
 Scale CAS latency with clock frequency
Programmable Burst Length
Khả năng cho phép tinh chỉnh thông số Burst length của DRAM giúp cho
người thiết kế có thể tìm ra được cách tổ hợp tốt hơn cho hệ thồng của
họ. Trong hầu hết các hệ thống, giá trị Burst length được cài đặt khi khởi
tạo và được giữ cố định sau đó.
- Use a short, fixed burst length.
- Explicitly identify the burst length in the read or write command.
- Program the burst length by blowing fuses on the DRAM.
- Use a long, fixed burst length coupled with the burst-terminate
command
- Use a BEDO-style protocol where each CAS pulse toggles out a single
column of data.
Programmable Burst Length
 Use Burst-Terminate Command (Burst Stop): Sử dụng lệnh Burst-
terminate để dừng tín hiệu data out hoặc thông báo đã hoàn thành ghi
data lên DRAM.
 Đơn giản hóa quá trình ghi data, chỉ cần terminate burst cuối cùng
trong một request pipeline
 Không thể dùng chung lệnh bus để điều khiển nhiều bank
 Toggle Data-Out Using CAS: Thay đổi data out bằng cách dùng CAS,
tức là đọc lần lượt từng cột dữ liệu bằng cách thay đổi các CAS pins,
hoặc giữ các pin đó ở mức thấp cho tới khi số cột dữ liệu mong muốn
được đọc ra hết. Cách này đòi hỏi phải có sự thay đổi trong thiết kế
DRAM
 Thay đổi bộ tập lệnh để có 2 tập lệnh CAS, một để đọc địa chỉ mới,
một để thông báo quá trình đọc dữ liệu theo thứ tự, dựa trên địa
chỉ của cột vừa mới đọc.
Programmable Burst Length
 Thêm một pin vào command bus, để thông báo chức năng mà CAS
đang làm việc.
Lợi thế của cách thứ 2 so với thứ 1 là cho phép memory controller điều
khiển bank khác của DRAM khi bank này đang trong quá trình truyền
dữ liệu.
Dual Edge Clocking
Các công nghệ khác với JEDEC :
 Use two or more interleaved memory banks on-chip and assign a
different clock signal to each bank.
 Keep each DRAM single data rate, and inter- leave banks on the
module (DIMM).
 Increase the number of pins per DRAM.
 Increase the number of pins per module.
 Double the clock frequency.
 Use simultaneous bidirectional I/O drivers.
Dual Edge Clocking
 Interleave On-Chip Banks : Dùng các bank xen kẽ với nhau và sử dụng
xung clock khác nhau cho mỗi bank. Cách này giúp tăng băng thông
của SDRAM lên 2, 3 hoặc 4 lần mà không dùng cả 2 cạnh của xung
clock để đọc/ghi data, bằng cách là chỉ định 2, 3, 4 bank mỗi DRAM và
dùng clock riêng biệt cho từng bank. Memory Controller sẽ gửi một
Request đến cho mỗi bank mà đồng bộ với clock dùng cho bank đó.
Do đó, mỗi bank sẽ nhận được request sớm hơn hoặc muộn hơn so
với các bank khác.
Có 2 cách để tạo ra tín hiệu clock khác nhau cho mỗi bank:
 Được gửi đến bởi Memory Controller.
 DRAM nhận được xung clock và delay clock đó để tạo ra các xung
clock khác cho mỗi bank.
Dual Edge Clocking
 Interleave Banks on the Module: Thay vì tăng băng thông của DRAM,
người ta có thể tạo ra một tham số sao cho nó chỉ ảnh hưởng lên ở
mức độ của DIMM. Do đó, có thể lấy một phần SDRAM để tạo ra
thông số DDR DIMM, mà mạch trên thanh RAM nhận một tín hiệu
xung clock và xen kẽ giữa 2 hay nhiều bank trên DRAM.
 Increase DRAM Data Width: Tăng bandwidth của DRAM, để tăng lưu
lượng truyền, cùng với việc tăng tốc độ DRAM, người ta còn tăng số
pin data-out lên gấp đôi nhờ đó data rate tăng lên gấp đôi.
 Increase Module Data Width: Tăng độ rộng dữ liệu của Module có thể
thực hiện bằng một cách đơn giản là tăng số chân tiếp xúc với
Memory Controller mà không cần phải tăng tốc độ clock cho từng
DRAM. Nhược điểm là tốn nhiều chi phí.
Dual Edge Clocking
 Double the Clock Frequency : Thay vì dùng Dual-Edge Clock thì
người ta chỉ dùng Single-Edge Clock và tăng gấp đôi tần số. Ưu điểm
là có thêm cạnh clock để ghi data lên bus hoặc lấy mẫu data từ bus. Và
xung clock không cần phải có sự cân đối giữa cạnh lên và cạnh xuống,
nhờ vậy có thể đạt tốc độ cao dễ dàng hơn Dual-Edge Clock . Nhươc
điểm là tốn phải thiết kế lại hệ thống để phù hợp với tần số cao.
 Use Simultaneous Bidirectional I/O : Dùng ngõ vào/ ra 2 hướng đồng
thời. nhờ vậy mà có thể đọc và ghi DRAM một cách đồng thời , dữ
liệu đọc và ghi đồng thời nằm trên bus, từ đó tăng hiệu quả băng
thông lên gấp đôi. Cơ chế này đòi hỏi phải có sự thay đổi cấu trúc trên
DRAM sao cho việc đọc và ghi diễn ra cùng lúc, giống như thiết kế của
ESDRAM.
Dual Edge Clocking
On-Chip PLL/DLL
DDR SDRAM sử dụng một mach DDL on-chip để đảm bảo rằng quá
trình DRAM truyền dữ liệu và tín hiệu DQS đến Memory Controller gần
nhất có thể với cạnh kế của xung clock hệ thống. Các công nghệ khác
như:
 Achieve high bandwidth using more DRAM pins or module pins, not
clock frequency
 Use a Vernier method to measure and account for dynamic changes
in skew
 Put the DLL on the memory controller
 Use off-chip (on-module) DLLs. Use asynchronous DRAM, for
example, toggle mode or BEDO
 Công nghệ DRAM càng phát triển, tốc độ trên 1 kênh ngày càng được
cải thiện nhưng dung lượng của kênh lại vì đó mà giảm đi.
- SDR SDRAM - 8 DIMM 1 kênh.
- DDR SDRAM - 4 DIMM 1 kênh.
- DDR2 SDRAM - 2 DIMM 1 kênh.
- DDR3 SDRAM - 1 DIMM 1 kênh.
Vấn đề đặt ra là phải cân bằng được giữa tốc độ và dung lượng kênh để
phù hợp với từng yêu cầu.
Fully Buffered DIMM
Công nghệ Fully Buffered DIMM là một sản phẩm phát triển của Intel.
Nói đơn giản thì nó giống như sự kết hợp giữa wide-bus của JEDEC và
narrow-bus của Rambus.
Issues in DRAM Systems, Briefly
Architecture and Scaling
Sự cải tiến về băng thông đi kèm với sự giới hạn về dung lượng kênh,
và sự truy xuất chi tiết. Qua mỗi thế hệ thì số lượng bit mà DRAM có thể
đọc/ ghi tăng lên gấp đôi. Do đó processor cần phải tăng gấp đôi lượng
dữ liệu đọc và ghi trong một phiên trao đổi dữ liệu, khả năng tăng lên đó
của processor liên quan đến khả năng đáp ứng của SRAM trong cache
block CPU.
Topology and Timing
Sự thay đổi về cấu trúc liên kết ( để tăng dung lượng kênh và tốc độ
truyền dữ liệu ) cũng gây ảnh hưởng đến timing. Timing quy ước từ
trước đó sẽ phải thay đổi để phù hợp với cấu trúc mới.
Pin and Protocol Efficiency
Giá của transistor hay tụ trên Die giảm khá nhanh nhưng chi phí để
đóng gói một chip thì lại không giảm kịp mức đó. Vì thế việc thiết kế
DRAM trong tương lại, người ta sẽ quan tâm về số pin nhiều hơn là số
lượng transistor. Điều này đòi hỏi thiết kế tốt hơn , và phải làm sao để
giảm số pin trên 1 đơn vị xuống mà kg làm thay đổi data bandwidth trên
nó.
Power and Heat Dissipation
DRAM thông thường vốn không cần phải quan tâm đến công suất và
nhiệt độ. DRAM và DIMM thông thường không đi kèm tản nhiệt. Nhưng
khi tốc độ của tín hiệu đạt trên 1Gbps/pin như các FBDIMM thì sẽ phát
sinh vấn đề. Công suất của FBDIMM hơn DIMM cũ khoảng 10 lần , và
việc gắn khoảng 25 FBDIMM trong một hệ thống sẽ sinh nhiệt lượng lớn,
lúc đó cần phải gắn các bộ tản nhiệt vào hệ thống Ram này.
Future Directions
Hướng đi về thiết kế DRAM trong tương lai chủ yếu tập trung vào
việc tăng bandwidth thông qua việc tăng pin rates.
Nhìn chung khả năng tối ưu hóa của hệ thống phụ thuộc vào
nhiều yếu tố trong đó phải xét đến góc nhìn của mỗi người thiết kế.
Và còn phụ thuộc vào 1 yếu tố quan trọng là khả năng tài chính khi
quyết định thay đổi thiết kế của một bộ phận nào đó.
Cảm ơn thầy và các bạn đã lắng nghe !

Weitere ähnliche Inhalte

Was ist angesagt?

CÂU HỎI và ĐÁP ÁN ôn thi Môn Triết học - cao học ( Thạc sĩ).
CÂU HỎI và ĐÁP ÁN ôn thi Môn Triết học - cao học ( Thạc sĩ).CÂU HỎI và ĐÁP ÁN ôn thi Môn Triết học - cao học ( Thạc sĩ).
CÂU HỎI và ĐÁP ÁN ôn thi Môn Triết học - cao học ( Thạc sĩ).
Nhận Viết Đề Tài Trọn Gói ZALO 0932091562
 
Đề Cương ôn tập kiến trúc máy tính và thiết bị ngoại vi
Đề Cương ôn tập kiến trúc máy tính và thiết bị ngoại viĐề Cương ôn tập kiến trúc máy tính và thiết bị ngoại vi
Đề Cương ôn tập kiến trúc máy tính và thiết bị ngoại vi
Đỗ Đức Hùng
 
Báo cáo kĩ thuật phần mềm và ứng dụng
Báo cáo kĩ thuật phần mềm và ứng dụngBáo cáo kĩ thuật phần mềm và ứng dụng
Báo cáo kĩ thuật phần mềm và ứng dụng
Vượng Đặng
 
Tom tat bai giang ly thuyet do thi - nguyen ngoc trung
Tom tat bai giang   ly thuyet do thi - nguyen ngoc trungTom tat bai giang   ly thuyet do thi - nguyen ngoc trung
Tom tat bai giang ly thuyet do thi - nguyen ngoc trung
Phi Phi
 

Was ist angesagt? (20)

Bài giảng XỬ LÝ TÍN HIỆU SỐ_10440012092019
Bài giảng XỬ LÝ TÍN HIỆU SỐ_10440012092019Bài giảng XỬ LÝ TÍN HIỆU SỐ_10440012092019
Bài giảng XỬ LÝ TÍN HIỆU SỐ_10440012092019
 
Ktmt chuong 5
Ktmt chuong 5Ktmt chuong 5
Ktmt chuong 5
 
Phụ thuộc hàm và dạng chuẩn 1
Phụ thuộc hàm và dạng chuẩn 1Phụ thuộc hàm và dạng chuẩn 1
Phụ thuộc hàm và dạng chuẩn 1
 
Kiến trúc máy tính và hợp ngữ bài 07
Kiến trúc máy tính và hợp ngữ bài 07Kiến trúc máy tính và hợp ngữ bài 07
Kiến trúc máy tính và hợp ngữ bài 07
 
Kiến trúc máy tính và hợp ngữ bài 05
Kiến trúc máy tính và hợp ngữ bài 05Kiến trúc máy tính và hợp ngữ bài 05
Kiến trúc máy tính và hợp ngữ bài 05
 
CÂU HỎI và ĐÁP ÁN ôn thi Môn Triết học - cao học ( Thạc sĩ).
CÂU HỎI và ĐÁP ÁN ôn thi Môn Triết học - cao học ( Thạc sĩ).CÂU HỎI và ĐÁP ÁN ôn thi Môn Triết học - cao học ( Thạc sĩ).
CÂU HỎI và ĐÁP ÁN ôn thi Môn Triết học - cao học ( Thạc sĩ).
 
đề thi java ptit
đề thi java ptitđề thi java ptit
đề thi java ptit
 
Bài 1: Tổng quan về cơ sở dữ liệu - Giáo trình FPT
Bài 1: Tổng quan về cơ sở dữ liệu - Giáo trình FPTBài 1: Tổng quan về cơ sở dữ liệu - Giáo trình FPT
Bài 1: Tổng quan về cơ sở dữ liệu - Giáo trình FPT
 
đồ áN phân tích thiết kế hệ thống quản lý bán hàng siêu thị
đồ áN phân tích thiết kế hệ thống quản lý bán hàng siêu thịđồ áN phân tích thiết kế hệ thống quản lý bán hàng siêu thị
đồ áN phân tích thiết kế hệ thống quản lý bán hàng siêu thị
 
Slide Hệ Quản Trị Cơ sở dữ liệu - CHƯƠNG 1
Slide Hệ Quản Trị Cơ sở dữ liệu - CHƯƠNG 1Slide Hệ Quản Trị Cơ sở dữ liệu - CHƯƠNG 1
Slide Hệ Quản Trị Cơ sở dữ liệu - CHƯƠNG 1
 
Đề Cương ôn tập kiến trúc máy tính và thiết bị ngoại vi
Đề Cương ôn tập kiến trúc máy tính và thiết bị ngoại viĐề Cương ôn tập kiến trúc máy tính và thiết bị ngoại vi
Đề Cương ôn tập kiến trúc máy tính và thiết bị ngoại vi
 
Đề tài: Hệ thống quản lý mua bán của trung tâm nội thất, HAY
Đề tài: Hệ thống quản lý mua bán của trung tâm nội thất, HAYĐề tài: Hệ thống quản lý mua bán của trung tâm nội thất, HAY
Đề tài: Hệ thống quản lý mua bán của trung tâm nội thất, HAY
 
UML mô hình khái niệm
UML mô hình khái niệmUML mô hình khái niệm
UML mô hình khái niệm
 
Phụ thuộc hàm và các dạng chuẩn - dhcntt
Phụ thuộc hàm và các dạng chuẩn - dhcnttPhụ thuộc hàm và các dạng chuẩn - dhcntt
Phụ thuộc hàm và các dạng chuẩn - dhcntt
 
Bo nho
Bo nhoBo nho
Bo nho
 
Dientuso Sld
Dientuso SldDientuso Sld
Dientuso Sld
 
Báo cáo kĩ thuật phần mềm và ứng dụng
Báo cáo kĩ thuật phần mềm và ứng dụngBáo cáo kĩ thuật phần mềm và ứng dụng
Báo cáo kĩ thuật phần mềm và ứng dụng
 
Luận văn: Xây dựng website quản lý nhà hàng, HOT
Luận văn: Xây dựng website quản lý nhà hàng, HOTLuận văn: Xây dựng website quản lý nhà hàng, HOT
Luận văn: Xây dựng website quản lý nhà hàng, HOT
 
Tom tat bai giang ly thuyet do thi - nguyen ngoc trung
Tom tat bai giang   ly thuyet do thi - nguyen ngoc trungTom tat bai giang   ly thuyet do thi - nguyen ngoc trung
Tom tat bai giang ly thuyet do thi - nguyen ngoc trung
 
Oop unit 13 tổng quan về uml
Oop unit 13 tổng quan về umlOop unit 13 tổng quan về uml
Oop unit 13 tổng quan về uml
 

Ähnlich wie Overview of-dram

cấu trúc máy tính Chuong4
cấu trúc máy tính Chuong4cấu trúc máy tính Chuong4
cấu trúc máy tính Chuong4
Thay Đổi
 
dien-tu-cong-nghiep__bai-giang-_-dien-tu-cong-nghiep----ch3 - [cuuduongthanco...
dien-tu-cong-nghiep__bai-giang-_-dien-tu-cong-nghiep----ch3 - [cuuduongthanco...dien-tu-cong-nghiep__bai-giang-_-dien-tu-cong-nghiep----ch3 - [cuuduongthanco...
dien-tu-cong-nghiep__bai-giang-_-dien-tu-cong-nghiep----ch3 - [cuuduongthanco...
JosKhanh1
 
Chuong 5 ram
Chuong 5 ramChuong 5 ram
Chuong 5 ram
VNG
 
Bao cao thuc tap tuan 1
Bao cao thuc tap tuan 1Bao cao thuc tap tuan 1
Bao cao thuc tap tuan 1
kanzakido
 

Ähnlich wie Overview of-dram (20)

Chap05_BoNho.pdf
Chap05_BoNho.pdfChap05_BoNho.pdf
Chap05_BoNho.pdf
 
GIỚI THIỆU VỀ HỆ THỐNG RAM SERVER
GIỚI THIỆU VỀ HỆ THỐNG RAM SERVERGIỚI THIỆU VỀ HỆ THỐNG RAM SERVER
GIỚI THIỆU VỀ HỆ THỐNG RAM SERVER
 
cấu trúc máy tính Chuong4
cấu trúc máy tính Chuong4cấu trúc máy tính Chuong4
cấu trúc máy tính Chuong4
 
Khac nhau bridge & route cho cấu hình cisco 878 megawan
Khac nhau bridge & route cho cấu hình cisco 878 megawanKhac nhau bridge & route cho cấu hình cisco 878 megawan
Khac nhau bridge & route cho cấu hình cisco 878 megawan
 
các thế hệ ram.pptx
các thế hệ ram.pptxcác thế hệ ram.pptx
các thế hệ ram.pptx
 
Bai 05 bo nho chinh ramrom
Bai 05  bo nho chinh ramromBai 05  bo nho chinh ramrom
Bai 05 bo nho chinh ramrom
 
Giáo trình kỹ thuật số chương 7 -8.doc
Giáo trình kỹ thuật số chương 7 -8.docGiáo trình kỹ thuật số chương 7 -8.doc
Giáo trình kỹ thuật số chương 7 -8.doc
 
Pdfbài 3 cpu và ram bảo trì sự cố máy tính-mastercode.vn
Pdfbài 3 cpu và ram   bảo trì sự cố máy tính-mastercode.vnPdfbài 3 cpu và ram   bảo trì sự cố máy tính-mastercode.vn
Pdfbài 3 cpu và ram bảo trì sự cố máy tính-mastercode.vn
 
Bao cao vdk_va_pic
Bao cao vdk_va_picBao cao vdk_va_pic
Bao cao vdk_va_pic
 
dien-tu-cong-nghiep__bai-giang-_-dien-tu-cong-nghiep----ch3 - [cuuduongthanco...
dien-tu-cong-nghiep__bai-giang-_-dien-tu-cong-nghiep----ch3 - [cuuduongthanco...dien-tu-cong-nghiep__bai-giang-_-dien-tu-cong-nghiep----ch3 - [cuuduongthanco...
dien-tu-cong-nghiep__bai-giang-_-dien-tu-cong-nghiep----ch3 - [cuuduongthanco...
 
Điều khiển động cơ sử dụng IC MCP4921
Điều khiển động cơ sử dụng IC MCP4921Điều khiển động cơ sử dụng IC MCP4921
Điều khiển động cơ sử dụng IC MCP4921
 
Phương pháp và chiến lược đối ứng tải trong Web Application Server
Phương pháp và chiến lược đối ứng tải trong Web Application ServerPhương pháp và chiến lược đối ứng tải trong Web Application Server
Phương pháp và chiến lược đối ứng tải trong Web Application Server
 
Chuong 5 ram
Chuong 5 ramChuong 5 ram
Chuong 5 ram
 
Chuong 5 ram
Chuong 5 ramChuong 5 ram
Chuong 5 ram
 
Chương 4 memory
Chương 4 memoryChương 4 memory
Chương 4 memory
 
Biến tần là gì voi auto base
Biến tần là gì voi auto baseBiến tần là gì voi auto base
Biến tần là gì voi auto base
 
ky thuat vi xu lychuong4.ppt
ky thuat vi xu lychuong4.pptky thuat vi xu lychuong4.ppt
ky thuat vi xu lychuong4.ppt
 
Bao cao thuc tap tuan 1
Bao cao thuc tap tuan 1Bao cao thuc tap tuan 1
Bao cao thuc tap tuan 1
 
Chuong 5 ram
Chuong 5 ramChuong 5 ram
Chuong 5 ram
 
Baocao1
Baocao1Baocao1
Baocao1
 

Overview of-dram

  • 1. OVERVIEW DRAM GVHD: ThS. Cao Trần Bảo Thương Sinh viên thực hiện : Nguyễn Nhật Quang 1020169 Mã Thanh Tuyền 1020261
  • 2. Nội Dung • Cấu tạo và hoạt động Dram cơ bản • Sự phát triển của kiến trúc Dram • Các tiêu chuẩn trong DRAM ngày nay • FB-DIMM • Nói ngắn gọn về các vấn đề của hệ thống DRAM
  • 3. Cấu tạo và hoạt động Dram cơ bản Một bộ nhớ truy cập ngẫu nhiên (RAM) mà sử dụng một transitor và một tụ duy nhất cho mỗi bit được gọi là bộ nhớ truy cập ngẫu nhiên động hoặc DRAM
  • 4. Tổ chức cơ bản của DRAM internals. Memory Controller truy xuất từng Cell riêng biệt bằng cách xác định giao của dòng và cột
  • 5. Những Memory Array trong Memory chip làm việc theo nhiều cách • Đồng thời • Độc lập • Nơi này và nơi khác Khi memory array được thiết kế hoạt động theo cách union , nó hoạt động như là một đơn vị. Số bit dữ liệu truyền và nhận bằng số dãy của DRAM mỗi lần Memory Controller truy suất vào nó.
  • 6. Ví dụ 4 array mỗi dãy đọc 1 bit data mỗi lần. Mỗi lần khi memory controller yêu cầu, 4 bit dữ liệu được gửi ra và nó được đọc ở mỗi cột bank
  • 7. Nhiều bank hoạt động độc lập => DRAM Đan xen nhiều bank đạt đươc tốc độ dữ liệu cao hơn Ví dụ: Nếu một DRAM bank có thể sản xuất một đoạn mới của dữ liệu mỗi 10 ns, nó có thể chuyển đổi qua lại giữa hai bank để sản xuất một đoạn mới mỗi 5 ns, hoặc luân chuyển giữa bốn bank để sản xuất một đoạn mới mỗi 2.5 ns, do đó tốc độ dữ liệu tăng gấp đôi hoặc gấp bốn lần có thể đạt được bởi bất kỳ bank nào.
  • 8. Một hệ thống cũng có nhiều DIMM , nó cũng được coi như là những bank hoạt động độc lập. Người ta dung “rank” để phân biệt DIMM hoạt động độc lập vs các bank nội hoạt động độc lập Các cấp tổ chức của một hệ thống Dram
  • 9. Tổ chức bus bộ nhớ JEDEC-style organization • Data: truyền dữ liệu đi và đến từ Dram • Address: Mang địa chỉ dòng và cột đến Dram • Control: Cho phép ngõ ra của hàng và cột • Chip-select: cho phép đợi yêu cầu của bộ nhớ
  • 10. Tổ chức hệ thống và các bước hoạt động đọc Dram
  • 11. Sự phát triển của kiến trúc Dram
  • 12. Sự thay đổi cấu trúc vì mục tiêu thông lượng Clocked DRAM - Là những Dram đầu tiên được điều khiển bởi tín hiệu clock nội The conventional Asynchoronous DRAM - Yêu cầu mỗi truy suất phải đi qua tất cả các bước được mô tả trước đó - Với mỗi lần truy suất : Bitline được sạc sẵn, kích hoạt row, đọc column sau khi kích hoạt row - Khi Column được đọc xong, row bị vô hiệu hoá hoặc đóng và bitline được nạp lại. - Theo quy ước và thiết kế mạch RAS và CAS phải tang đồng loạt
  • 13. Ví dụ: Sự thay đổi cấu trúc vì mục tiêu thông lượng
  • 14. Sự thay đổi cấu trúc vì mục tiêu thông lượng Fast Page Mode DRAM (FPM DRAM) - Địa chỉ hàng được tổ chức liên tục nên bộ cảm biến có thể đọc dữ liệu từ nhiều cột - Tạo ra bộ nhớ cache của các data đầu ra hoạt động trong cảm biến => Tạo thành một “open page” có thể truy cập nhanh chóng - => Tăng tốc độ truy cập liên tiếp đến cùng một hàng
  • 15. Sự thay đổi cấu trúc vì mục tiêu thông lượng Extended Data-Out DRAM (EDO DRAM) - EDO DRAM (hyper-page mode DRAM) là FPM DRAM thêm một vài transistor vào output để tạo ra một chốt giữa cảm biến và output của DRAM - Chốt này giữ các trạng thái tại output pin, cho phép CAS deassert nhanh chóng, memory array sạc sớm hơn => EDO DRAM hoạt động nhanh hơn FPM DRAM
  • 16. Sự thay đổi cấu trúc vì mục tiêu thông lượng Burst-Mode EDO DRAM (BEDO DRAM) - BEDO được xây dựng trên EDO bằng cách thêm các khái niệm về “bursting" các khối dữ liệu liền kề nhau từ một hàng đã kích hoạt mỗi khi một địa chỉ cột mới được gửi đến các chip DRAM - Thêm vào một bộ đếm nội, đầu tiên là nhận địa chỉ tới và sau đó tự động tăng giá trị địa chỉ cột mỗi lần chuyển đổi CAS, và DRAM gửi tuần tự dữ liệu cột tiếp theo vào bus. - Nhanh hơn EDO vì địa chỉ cột được điều khiển bằng tín hiệu nội
  • 17. Sự thay đổi cấu trúc vì mục tiêu thông lượng Synchronous DRAM (SDRAM) - Bằng cách kết hợp tất cả các dữ liệu và điều khiển truyền nhận với một tín hiệu clock, thời gian diển ra các sự kiện dễ dự đoán và chương trình ít nghiêng tức là hệ thống có khả năng đạt được vòng quay nhanh hơn trên các yêu cầu, do đó hiệu suất thông lượng cao hơn.
  • 18. Sự thay đổi cấu trúc vì mục tiêu thông lượng Synchronous DRAM (SDRAM) - Giống như BEDO DRAM, SDRAM hỗ trợ khái niệm về burst mode. SDRAM có programmable register chứa một burst length. Nhờ đó DRAM xác định có bao nhiêu cột đưa ra output trên các chu kỳ liên tiếp => loại bỏ các tín hiệu timing như là chuyển đổi qua lại của CAS , làm giảm băng thông sử dụng lệnh
  • 19. Sự thay đổi giao diện vì mục tiêu thông lượng Rambus DRAM (RDRAM , Concurrent RDRAM, Direct RDRAM) RDRAM: - Sử dụng đường bus hẹp đáng kể so với bus truyền thống. - Các tín hiệu bus Address, control, data và chip select đi trên cùng một dây nhưng ở không đồng thời. - Bus RDRAM rộng 1 byte, tần số 250Mhz, truyền dữ liệu trên cả hai cạnh xung clock để đạt được băng thông lý tưởng là 500 MB/s - Các giao dịch trên bus sử dụng một giao thức phân chia yêu cầu / đáp ứng
  • 20. Sự thay đổi giao diện vì mục tiêu thông lượng RDRAM: Vd: - Đầu tiên gói address/control được đưa vào gồm toàn bộ địa chỉ hàng và địa chỉ cột, và sau đó dữ liệu được đưa vào. - Các giao dịch khác nhau có thể yêu cầu số chu kỳ giao dịch khác nhau, tùy thuộc vào: loại giao dịch, vị trí của dữ liệu trong thiết bị, số các thiết bị trên một kênh
  • 21. Sự thay đổi giao diện vì mục tiêu thông lượng Concurrent RDRAM: - Bus được chia thành các phân đoạn riêng biệt: address, command và data giống như tổ chức Dram JEDEC style - Data segment rộng 1byte được thêm một 1bit address segment và 1bit control segment.Như thế bus có 3 phân đoạn riêng biệt có thể hành động đồng thời và riêng biệt . => Đơn giản hoá giao dịch, tăng hiệu quả làm việc của RDRAM
  • 22. Sự thay đổi giao diện vì mục tiêu thông lượng Direct RDRAM: - Tăng độ rộng data segment đến 2 byte, address segment 5 bit, và control segment 3 bit => Tăng thông lượng dữ liệu trên kênh - Tốc độ hoạt động Rdram gấp đôi so với tốc độ ban đầu , đạt 500Mhz trong những năm gần đây. - Thêm bộ đệm nửa hàng giữa các bank lân cận => giảm chi phí
  • 23. Sự thay đổi giao diện vì mục tiêu thông lượng DDR SDRAM - Double Data Rate DRAM - DDR tăng gấp đôi băng thông dữ liệu của SDRAM bằng cách truyền dữ liệu ở cả hai cạnh của clock - DDR SDRAM tương tự với SDRAM: cùng công nghệ truyền tín hiệu, giao diện đặc tính kĩ thuật, các chân ngõ ra trên DIMM - DDR SDRAM truyền nhận bên trong từ cácd dãy SDRAM tương , đọc và ghi 2 lần số bit như SDRAM
  • 24. Sự thay đổi cấu trúc về mục tiêu độ trễ Virtual Channel Memory (VCDRAM) - Thêm vào bộ nhớ cache SRAM đáng kể để đệm khối dữ liệu lớn. Bộ nhớ cache này được quản lý bởi memory controller . - Một hàng kích hoạt du chuyển cả 1 trang dữ liệu vào cảm biến . Hoạt động “Prefetch” and “restore” di chuyển dữ liệu giữa cảm biến và các phân đoạn cache SDAM cùng thời điểm.Hoạt động cột đọc hoặc ghi di chuyển cột dữ liệu giữa phân đoạn cache và bộ đệm đầu ra
  • 25. Sự thay đổi cấu trúc về mục tiêu độ trễ Enhanced SDRAM (ESDRAM) - Như EDO DRAM, ESDRAM thêm một chốt SRAM vào trong lõi DRAM, trong khi EDO thêm các chốt sau cột MUX , ESDRAM thêm nó trước khi cột MUX . Do đó, các chốt rộng như một trang DRAM. - Điều này cho phép chồng chéo trong hoạt động - Cơ chế ghi xung quanh trong đó có thể bắt đầu ghi mà không cần đóng hàng đang hoạt động
  • 26. Sự thay đổi cấu trúc về mục tiêu độ trễ MoSys 1T-SRAM - Được tạo thành bằng việc bọc xung quanh một lõi DRAM tốc độ cao bởi một SRAM interface - Lõi DRAM gồm một số lượng rất lớn các bank, giảm kích thước của một bank làm cho thời gian truy cập nhanh hơn nhưng tăng số lượng bank, mạch điều khiển phức tạp và tốn chi phí và giảm hiệu quả - DRAM có độ trễ thấp nhất , thích hợp với các hệ thống nhúng tốc độ cao và các hệ thống game.
  • 27. Sự thay đổi cấu trúc về mục tiêu độ trễ Reduced Latency DRAM (RLDRAM) - Lõi DRAM nhanh mà không có đặc điểm kỹ thuật của DIMM , sử dụng trong môi trường điều khiển bộ nhớ trực tiếp. - Giao diện trực iếp đến chip làm giảm clock skew, do đó tăng một phần tốc độ của interface
  • 28. Sự thay đổi sự thay đổi cấu trúc về mục tiêu độ trễ Fast Cycle DRAM (FCRAM) - FCRAM đạt độ trễ thấp truy cập dữ liệu bằng cách phân chia các mảng dữ liệu thành các mảng con giống như việc kích thước của mảng - Mảng dữ liệu con được quy định bằng cách thêm bit vào địa chỉ hàng, do đó cơ chế chủ yếu là đưa một phần của địa chỉ cột vào hàng được kích hoạt. - Chỉ một trong số các mảng con được điều khiển trong khi một hàng được kích hoạt. - Có băng thông cao nhất của DIMM .
  • 29. JEDEC’s SDRAM Technology  JEDEC: Joint Electron Device Engineer-ing Council  JEDEC SDRAMs use the traditional DRAM- system Organization  Có 4 loại đường bus, sử dụng riêng biệt cho từng chức năng. Bao gồm: (1) data, (2) address, (3) control, và (4) chip-select busses. Các đường bus này còn được gọi là “memory bus”.  Data bus là bus tương đối rộng. Độ rộng càng lớn thì hiệu suất của hệ thống càng cao.  Address bus có độ rộng phụ thuộc vào số bit lưu trữ trong Ram. Độ rộng tiêu biểu của loại bus này là 15 bits.
  • 30.  Control bus: bao gồm tín hiệu row, columm, output enable, và các tín hiệu có tính chất tương tự  Chip select bus: là tín hiệu suy nhất điều khiển dãy Ram trong hệ thống. Với mục đích cho phép dãy Ram đọc lệnh và thực hiện chúng.  Một điểm mới có trên SDRAM mà công nghệ DRAM cũ không có là sự tích hợp system clock.
  • 31. Single Data Rate SDRAM Sử dụng single-edged clock để đồng bộ tất cả các tín hiệu. SDRAM có mốt số tính năng mà các thế hệ DRAM trước đó chưa có là: Programmable burst length và Programmable CAS lantency  Programmable burst length: Giá trị Burst length được thiết lập từ tước và lưu trữ vào một thanh ghi. SDRAM mỗi khi nhận được row address hay column address thì sẽ thực hiện quá trình đọc/ghi burst với giá trị burst đã được lưu từ trước. Nhờ vậy mà quá trình đọc/ghi có thể cải thiện tốc độ thêm một bước nữa.  Programmable CAS latency: Tương tự như Burst length, giá trị của CAS latency cũng có thể lập trình và được lưu vào một thanh ghi trên SDRAM.
  • 32. Double Data Rate SDRAM DDR SDRAM có mốt số tính năng mà SDR DRAM không có là: Dual-Edged Clocking và Onchip Delay-locked loop  Dual-Edged Clocking: Trong DDR SDRAM quá trình trao đổi data sử dụng dual-edged clock.
  • 33. Single-edged clock & Dual-Edged Clock
  • 34.  On-Chip Delay-Locked Loop: Mạch DLL đảm bảo cho data truyền đi được đồng bộ với tín hiệu clock của memory controller. Vì thế data có thể đến memory controller đúng lúc. Memory controller điển hình có 2 nguồn clock : một được đồng bộ với xung clock chính, và một được delay 90 𝑜 dùng để lấy mãu data đến từ Ram. PLL (Phase locked loop) sử dụng mạch điều chế để tạo ra tín hiệu xung mới có thể đồng bộ với các tín hiệu khác.
  • 36. DDR SDRAM with a DLL
  • 37.
  • 38. Rambus in Particular • Trong hệ thống Rambus thì tất cả các data, address, command, tín hiệu chip-select được truyền trên cùng một đường Bus. Vào từng thời điểm khác nhau trên đường Bus thì thông tin truyền trên đó là không giống nhau. Đây là lý do tại sao hệ thống chứa Rambus còn được gọi là “Multiplexed” • Mặt khác, một hệ thống Rambus sử dụng đường bus vật lý khá khiêm tốn, nó có thể nhỏ hơn rất nhiều so với đường bus trên hệ thống thông thường khác. Do đó, phiên truyền tín hiệu trên hệ thống Rambus lúc nào cũng cần nhiều chu kỳ bus hơn so với hệ thống JEDEC truyền thống.
  • 39.
  • 40. Để thực hiện được điều trên thì một hệ thống Rambus cần phải có: • Bộ memory controller (bus master) có khả năng đóng gói các thông tin để truyền đi • Các khối DRAM có khả năng giải mã gói tin và nhận biết xem gói tin đó có được gửi đến cho mình không. Mặc dù tất cả các hoạt động của DRAM vẫn dựa trên sự điều khiển của memory controller, nhưng với khả năng tự nhận biết các gói tin nên các DRAM trên hệ thống Rambus vẫn được gọi là các thiết bị bán thông minh.
  • 41. Low-Skew Clock Using Variable Delay Circuits Có 2 tín hiệu clock được đưa vào mỗi DRAM device, và độ dài đường đi của mỗi tín hiệu clock là tương thích, Skew Clock của hệ thống được hạn chế bằng cách lấy giá trị trung bình của 2 tín hiệu clock input để được giá trị điểm giữa hoặc điểm đảo chiều clock.
  • 42. Variable Request Lantency Là 1 cơ chế cho phép Memory controller xác định khoảng thời gian DRAM phải đợi trước khi handling request. Đặc tính của cơ chế này được mô tả bởi 2 giai đoạn.  Thanh ghi Access-time lưu giá trị delay . DRAM dựa vào giá trị này để biết phải đợi trong bao nhiêu chu kỳ trước khi thực hiện trao đổi dữ liệu.  DRAM xác định khoảng delay cho quá trình responding request
  • 43. Tầm quan trọng của variable request latencies trong hệ thống Rambus
  • 44. Variable Block size Là cơ chế cho phép memory controller có thể xác định lượng data sẽ được truyền. Giá trị này được memory controller gửi đi trong 1 request packet và được gọi là BlockSize field. Giá trị này có thể giao động từ 0 byte tới 1024 bytes. Cơ chế này cho phép có thể sử dụng Rambus trong nhiều mục đích thiết lập khác nhau, và đảm bảo hệ thống Rambus hoạt động hết hiệu năng của nó. Running the Clock at the Data rate Vấn đề về phân bổ clock trong hệ thống được khắc phục bằng cách sử dụng 1 xung clock riêng cho đường bus. Và xung này có giá trị tần số bằng 1 nửa so với tần số của bus cycle.
  • 45. SO SÁNH CÔNG NGHỆ JEDEC VÀ RAMBUS Programmable CAS Latency  JEDEC: Cho phép các hãng sản xuất thay đổi thông số này để tối ưu hóa hiệu năng của hệ thống. Thông số này được lập trình vào lúc khởi động hệ thống, và theo như những người thiết kế thì sẽ không được thay đổi trong suốt quá trình hệ thống đang hoạt động.  Rambus: Latency được thiết lập ở mỗi lần bộ xử lý gửi một request tới cho DRAM, nhưng cách này cho phép mỗi thanh ghi được truy vấn có thể lưu 2 hay nhiều hơn loại dữ liệu mà dùng các phương thức truyền khác nhau. Hệ thống sử dụng Rambus có thể thay đổi Latency theo từng request một. Và thông số này cho phép lập trình nhiều giá trị độ trễ khác nhau. Điều này có thể không cần thiết với hệ thống JEDEC nhưng là bắt buộc đối với hệ thống Rambus.
  • 46. Programmable Burst Length  JEDEC: Cho phép các hãng sản xuất thay đổi thông số này để tối ưu hóa hiệu năng của hệ thống. Thông số này được thiết lập lúc khởi động hệ thống, và sẽ không được thay đổi trong suốt quá trình hệ thống đang hoạt động.  Rambus: Block size được lập trình lại mỗi lần bộ xử lý gửi một request cho DRAM. Một hệ thống JEDEC có thể hoạt động hiệu quả nếu mỗi cột dữ liệu read / write được đính kèm với một tín hiệu CAS. Nhưng hệ thống Rambus không làm được điều này, vì với một lệnh thì sẽ tiêu tốn thêm một nửa chu kì bus.
  • 47. Dual-Edged Clocking  JEDEC: Tín hiệu định thời là một xung clock trong được sinh ra bởi xung clock của hệ thống và DQS data strobe. Dữ liệu được chốt nhờ các cạnh của xung clock hệ thống  Rambus: Tín hiệu định thời được tổng hợp từ nguồn clock nội mà không đồng bộ với bất kì tín hiệu nguồn nào trong hệ thống. Tín hiệu này được sinh ra từ 2 pha khác nhau của xung clock global (U- shaped). Ngược lại với cơ chế clock DDR, cơ chế clock của Rambus không trùng với pha nào của xung clock hệ thống, cả theo cạnh hay điểm giữa của xung clock. Hơn nữa là có độ trễ giữa tín hiệu data out và xung clock global trong khi công nghệ DDR SDRAM thì hướng đến sự đồng pha.
  • 48. On-Chip PLL/DLL  JEDEC: Sử dụng on-chip DDL để đảm bảo dữ liệu đang được ghi vào data bus đồng pha với clock global. Bộ DDL làm điều này bằng cách delay tín hiệu phản hồi của DRAM đối với request đọc đủ lâu để dữ liệu được ghi vào ngay lúc DRAM thấy được cạnh của xung clock tiếp theo.  Rambus: Sử dụng một mạch on-chip Variable Delay để đảm bảo rằng mỗi DRAM trong hệ thống và memory controller có sự đồng bộ về clock. Mạch delay làm điều này bằng cách tìm điểm giữa của 2 pha trên cùng một tín hiệu và để tạo ra một xung clock tổng hợp, không đồng bộ với bất kì xung clock nào khác trong hệ thống. Quá trình này phức tạp hơn DLL thông thường nên mạch Variable Delay của Rambus cũng phức tạp hơn mạch DLL thông thường.
  • 49. CÁC CÔNG NGHỆ KHÁC Programmable CAS Latency  Sự có mặt của Programmable CAS Latency trong DRAM giúp cho thành phần chạy nhanh có thể mô phỏng được tiến trình của phần chậm, nhờ đó người ta có thể kết hợp nhiều thành phần thuộc nhiều thế hệ khác nhau ( với tốc độ khác nhau ) trong cùng một hệ thống, hoặc các thành phần cùng thế hệ nhưng khác hãng sản xuất ( hiệu năng có thể khác biệt đôi chút do công nghệ sản xuất ) trong cùng một thanh RAM.  Use fixed CAS latency parts  Explicitly identify the CAS latency in the read or write command  Program CAS latency by using fuses on the DRAM  Scale CAS latency with clock frequency
  • 50. Programmable Burst Length Khả năng cho phép tinh chỉnh thông số Burst length của DRAM giúp cho người thiết kế có thể tìm ra được cách tổ hợp tốt hơn cho hệ thồng của họ. Trong hầu hết các hệ thống, giá trị Burst length được cài đặt khi khởi tạo và được giữ cố định sau đó. - Use a short, fixed burst length. - Explicitly identify the burst length in the read or write command. - Program the burst length by blowing fuses on the DRAM. - Use a long, fixed burst length coupled with the burst-terminate command - Use a BEDO-style protocol where each CAS pulse toggles out a single column of data.
  • 51. Programmable Burst Length  Use Burst-Terminate Command (Burst Stop): Sử dụng lệnh Burst- terminate để dừng tín hiệu data out hoặc thông báo đã hoàn thành ghi data lên DRAM.  Đơn giản hóa quá trình ghi data, chỉ cần terminate burst cuối cùng trong một request pipeline  Không thể dùng chung lệnh bus để điều khiển nhiều bank  Toggle Data-Out Using CAS: Thay đổi data out bằng cách dùng CAS, tức là đọc lần lượt từng cột dữ liệu bằng cách thay đổi các CAS pins, hoặc giữ các pin đó ở mức thấp cho tới khi số cột dữ liệu mong muốn được đọc ra hết. Cách này đòi hỏi phải có sự thay đổi trong thiết kế DRAM  Thay đổi bộ tập lệnh để có 2 tập lệnh CAS, một để đọc địa chỉ mới, một để thông báo quá trình đọc dữ liệu theo thứ tự, dựa trên địa chỉ của cột vừa mới đọc.
  • 52. Programmable Burst Length  Thêm một pin vào command bus, để thông báo chức năng mà CAS đang làm việc. Lợi thế của cách thứ 2 so với thứ 1 là cho phép memory controller điều khiển bank khác của DRAM khi bank này đang trong quá trình truyền dữ liệu.
  • 53. Dual Edge Clocking Các công nghệ khác với JEDEC :  Use two or more interleaved memory banks on-chip and assign a different clock signal to each bank.  Keep each DRAM single data rate, and inter- leave banks on the module (DIMM).  Increase the number of pins per DRAM.  Increase the number of pins per module.  Double the clock frequency.  Use simultaneous bidirectional I/O drivers.
  • 54. Dual Edge Clocking  Interleave On-Chip Banks : Dùng các bank xen kẽ với nhau và sử dụng xung clock khác nhau cho mỗi bank. Cách này giúp tăng băng thông của SDRAM lên 2, 3 hoặc 4 lần mà không dùng cả 2 cạnh của xung clock để đọc/ghi data, bằng cách là chỉ định 2, 3, 4 bank mỗi DRAM và dùng clock riêng biệt cho từng bank. Memory Controller sẽ gửi một Request đến cho mỗi bank mà đồng bộ với clock dùng cho bank đó. Do đó, mỗi bank sẽ nhận được request sớm hơn hoặc muộn hơn so với các bank khác. Có 2 cách để tạo ra tín hiệu clock khác nhau cho mỗi bank:  Được gửi đến bởi Memory Controller.  DRAM nhận được xung clock và delay clock đó để tạo ra các xung clock khác cho mỗi bank.
  • 55. Dual Edge Clocking  Interleave Banks on the Module: Thay vì tăng băng thông của DRAM, người ta có thể tạo ra một tham số sao cho nó chỉ ảnh hưởng lên ở mức độ của DIMM. Do đó, có thể lấy một phần SDRAM để tạo ra thông số DDR DIMM, mà mạch trên thanh RAM nhận một tín hiệu xung clock và xen kẽ giữa 2 hay nhiều bank trên DRAM.  Increase DRAM Data Width: Tăng bandwidth của DRAM, để tăng lưu lượng truyền, cùng với việc tăng tốc độ DRAM, người ta còn tăng số pin data-out lên gấp đôi nhờ đó data rate tăng lên gấp đôi.  Increase Module Data Width: Tăng độ rộng dữ liệu của Module có thể thực hiện bằng một cách đơn giản là tăng số chân tiếp xúc với Memory Controller mà không cần phải tăng tốc độ clock cho từng DRAM. Nhược điểm là tốn nhiều chi phí.
  • 56. Dual Edge Clocking  Double the Clock Frequency : Thay vì dùng Dual-Edge Clock thì người ta chỉ dùng Single-Edge Clock và tăng gấp đôi tần số. Ưu điểm là có thêm cạnh clock để ghi data lên bus hoặc lấy mẫu data từ bus. Và xung clock không cần phải có sự cân đối giữa cạnh lên và cạnh xuống, nhờ vậy có thể đạt tốc độ cao dễ dàng hơn Dual-Edge Clock . Nhươc điểm là tốn phải thiết kế lại hệ thống để phù hợp với tần số cao.  Use Simultaneous Bidirectional I/O : Dùng ngõ vào/ ra 2 hướng đồng thời. nhờ vậy mà có thể đọc và ghi DRAM một cách đồng thời , dữ liệu đọc và ghi đồng thời nằm trên bus, từ đó tăng hiệu quả băng thông lên gấp đôi. Cơ chế này đòi hỏi phải có sự thay đổi cấu trúc trên DRAM sao cho việc đọc và ghi diễn ra cùng lúc, giống như thiết kế của ESDRAM.
  • 57. Dual Edge Clocking On-Chip PLL/DLL DDR SDRAM sử dụng một mach DDL on-chip để đảm bảo rằng quá trình DRAM truyền dữ liệu và tín hiệu DQS đến Memory Controller gần nhất có thể với cạnh kế của xung clock hệ thống. Các công nghệ khác như:  Achieve high bandwidth using more DRAM pins or module pins, not clock frequency  Use a Vernier method to measure and account for dynamic changes in skew  Put the DLL on the memory controller  Use off-chip (on-module) DLLs. Use asynchronous DRAM, for example, toggle mode or BEDO
  • 58.  Công nghệ DRAM càng phát triển, tốc độ trên 1 kênh ngày càng được cải thiện nhưng dung lượng của kênh lại vì đó mà giảm đi. - SDR SDRAM - 8 DIMM 1 kênh. - DDR SDRAM - 4 DIMM 1 kênh. - DDR2 SDRAM - 2 DIMM 1 kênh. - DDR3 SDRAM - 1 DIMM 1 kênh. Vấn đề đặt ra là phải cân bằng được giữa tốc độ và dung lượng kênh để phù hợp với từng yêu cầu.
  • 59. Fully Buffered DIMM Công nghệ Fully Buffered DIMM là một sản phẩm phát triển của Intel. Nói đơn giản thì nó giống như sự kết hợp giữa wide-bus của JEDEC và narrow-bus của Rambus.
  • 60. Issues in DRAM Systems, Briefly Architecture and Scaling Sự cải tiến về băng thông đi kèm với sự giới hạn về dung lượng kênh, và sự truy xuất chi tiết. Qua mỗi thế hệ thì số lượng bit mà DRAM có thể đọc/ ghi tăng lên gấp đôi. Do đó processor cần phải tăng gấp đôi lượng dữ liệu đọc và ghi trong một phiên trao đổi dữ liệu, khả năng tăng lên đó của processor liên quan đến khả năng đáp ứng của SRAM trong cache block CPU. Topology and Timing Sự thay đổi về cấu trúc liên kết ( để tăng dung lượng kênh và tốc độ truyền dữ liệu ) cũng gây ảnh hưởng đến timing. Timing quy ước từ trước đó sẽ phải thay đổi để phù hợp với cấu trúc mới.
  • 61. Pin and Protocol Efficiency Giá của transistor hay tụ trên Die giảm khá nhanh nhưng chi phí để đóng gói một chip thì lại không giảm kịp mức đó. Vì thế việc thiết kế DRAM trong tương lại, người ta sẽ quan tâm về số pin nhiều hơn là số lượng transistor. Điều này đòi hỏi thiết kế tốt hơn , và phải làm sao để giảm số pin trên 1 đơn vị xuống mà kg làm thay đổi data bandwidth trên nó. Power and Heat Dissipation DRAM thông thường vốn không cần phải quan tâm đến công suất và nhiệt độ. DRAM và DIMM thông thường không đi kèm tản nhiệt. Nhưng khi tốc độ của tín hiệu đạt trên 1Gbps/pin như các FBDIMM thì sẽ phát sinh vấn đề. Công suất của FBDIMM hơn DIMM cũ khoảng 10 lần , và việc gắn khoảng 25 FBDIMM trong một hệ thống sẽ sinh nhiệt lượng lớn, lúc đó cần phải gắn các bộ tản nhiệt vào hệ thống Ram này.
  • 62. Future Directions Hướng đi về thiết kế DRAM trong tương lai chủ yếu tập trung vào việc tăng bandwidth thông qua việc tăng pin rates. Nhìn chung khả năng tối ưu hóa của hệ thống phụ thuộc vào nhiều yếu tố trong đó phải xét đến góc nhìn của mỗi người thiết kế. Và còn phụ thuộc vào 1 yếu tố quan trọng là khả năng tài chính khi quyết định thay đổi thiết kế của một bộ phận nào đó.
  • 63. Cảm ơn thầy và các bạn đã lắng nghe !

Hinweis der Redaktion

  1. Chào thầy và các bạn, hôm nay nhóm mình sẽ thuyết trình về tổng quan của DRAM. Nhóm mình gồm có mình và bạn Nguyễn Nhật Quang
  2. Nội Dung bao gồm những khái niệm cơ bản của Dram như là Internals , hoạt động, quá trình phát triển kiến trúc Dram,
  3. Trước khi tìm hiểu cấu tạo và hoạt động của Dram cơ bản chúng ta cần phải biết DRAM là gì . Một bộ nhớ truy cập ngẫu nhiên. Random Access Memory sử dụng 1 transitor nối 1 tụ điên cho mỗi bit được gọi là bộ nhớ truy cặp ngẫu nhiên động. Dynamic Random Access Memory
  4. Mỗi DRAM die bao gồm một hoặc nhiều những dãy nhớ, lưới chữ nhật lưu trữ các cell vs mỗi cell chứa 1 bit dữ liệu. Dãy nhớ được sắp xếp theo hàng và cột như hình. Bằng việc xác định giao của hàng và cột , memory controller có thể truy suất các cell riêng biệt được lưu trữ trong dram chip như việc đọc và viết
  5. Ví dụ minh hoạ về cách hoạt động union. trong mộtcấu tạo đơn giản, x4 DRAM là DRAM có ít nhất 4 memory array và chiều rộng mỗi cột là 4 bit. mỗi dãy đọc 1 bit data và gửi ra 4 bit mỗi lần khi memory controller yêu cầu mỗi dãy đọc 1 bit data . Khi memory controller yêu cầu thì dữ liệu được đưa ra và nó đọc dữ liệu ở mỗi cột . Mỗi bộ các mảng nhớ hoạt động độc lập vs những bộ khác được gọi là bank .
  6. Người ta sử dụng các bank hoạt động độc lập để thiết kế nên dram. Đan xen nhiều ngân hàng bộ nhớ là một phương pháp phổ biến được sử dụng để đạt đạt được bus bộ nhớ băng thông cao nhằm sử dụng trong các ứng dụng bang thông thấp Trong một hệ thống bộ nhớ xen kẽ, bus dữ liệu sử dụng một tần số đó là nhanh hơn so với bất kỳ bank một DRAM có thể hỗ trợ; các mạch điều khiển bật tắt qua lại giữa nhiều ngân hàng để đạt được tốc độ dữ liệu này.
  7. Đây là hình ảnh mô tả các cấp tổ chức của một hệ thống dram hiện đại Một hệ thống gồm nhiều DIMM độc lập. Mỗi DIMM có thể chứa một hoặc nhiều rank độc lập Mỗi rank là một tập hợp các DRAM hoạt động cùng một lúc và trong nội bộ mỗi DRAM có nhiều bank độc . Trong mỗi bank bao gồm các memory array . Có đồng thời ở các rank level và bank level cung cấp băng thông thông qua khả năng yêu cầu đường ống. Có nhiều DRAM hành động đồng loạt ở rank level và nhiều mảng hoạt động đồng loạt ở bank level cung cấp băng thông trong các hình thức truy cập song song.
  8. Tổ chức bus bộ nhớ theo JEDEC style bao gồm các đường bus : data, address, control, chip-select. Được minh hoạ ở hỉnh sao. Data bus truyền dự liệu đi và đến từ DRAM, thường có độ rộng 64 bit và có thể rộng hơn trong các hệ thống hiệu suất cao. Address bus mang dịa chỉ dòng và cột đến DRAM , độ rộng của nó tuỳ thuộc vào lưu trữ vật lí trên dram (điển hình hiện nay là 15 bit). Control bus bao gồm các tín hiệu nhấp nháy cho phép ngõ ra của hàng và cột , clock, hoặc các tín hiệu liên quan. Cúi cùng là chip-select kết nối từ controller đến các rank , nó cho phép nơi nhận đợi yêu cầu của bộ nhớ, Chip select bao gồm những dây riêng biệt cho mỗi rank trên hệ thống , tín hiệu của nó chỉ đi qua 1 dây duy nhất đến bộ dram, nó cho phép hoặc vô hiệu hoá dram ở cùng rank để xữ lí hoặc phớt lờ các yêu cầu hiện tại trên bus.
  9. Dram kết nối gián tiếp đến CPU thông wa memory controller, nên nó không cần phải biết dram hoạt động chi tiết như thế nào, nó gửi yêu cầu đến memory controller và memory controller đáp ứng. Đây là trường hợp đơn giản được mô tả như hình. A: phiên yêu cầu từ CPU được đưa vào hàng đợi B: phiên yêu cầu được chuyển đến Memory controller C: phiên chuyển thành câu lệnh ,nó có thể đưa vào hàng đợi cho đến khi tất cả yêu cầu yêu tiên, trước đó được sử lí xong và Dram sẵn sàng
  10. Đây là hình miêu tả sự phát triển của kiến trúc DRAM. Từ clock đền đồng bộ, đến fage fast mode (FPM) được thiết kế bổ sung thêm khả năng chứa được nội dung của bộ cảm biến trên nhiều cột truy cập. Ròi đến EDO , extended dataout là FPM thiết kế them 1 chốt đầu ra sau multiplipxor. Ròi đến burst EDO là EDO thiết kế them vào bộ đếm chọn địa chỉ cột ở chốt một cách tuỳ ý. Ròi đến SDRAM thiết kế them 1 clock hệ thống mà chịn địa chỉ cột và dòng của mạch. Từ SDRAM đã có những thiết kế phong phú từ ngành công Nghiệp DRAM. Dram mới đc chia thành 2 loại chính, mục tiêu tăng năng suất và mục tiêu giảm độ trễ
  11. Ở đây RAS và CAS fải tang đồng loạt. Không thể giữ RAS khi chuyển đổi CAS
  12. Địa chỉ hàng được tổ chức liên tục nên bộ cảm biến có thể đọc dữ liệu từ nhiều cột => cải tiền từ Dram đồng bộ RAS có thể đươc giữ thấp khi CAS thay đổi qua lại Tạo ra bộ nhớ cache của các data đầu ra hoạt động trong cảm biến . Điều nàyTạo thành một “open page” có thể truy cập 1 cách nhanh chóng dẫn đến tăng tốc độ truy cập liên tiếp đến cùng một hàng
  13. EDO DRAM (hyper-page mode DRAM) là FPM DRAM thêm một vài transistor vào output để tạo ra một chốt giữa cảm biến và output của DRAM Chốt này giữ các trạng thái tại output pin, cho phép CAS deassert nhanh chóng, memory array sạc sớm hơn EDO DRAM hoạt động nhanh hơn FPM DRAM , nhanh hơn ít nhất từ 10 đến 15% so với FPM
  14. Trước đó ở EDO dram latch đại chỉ cột được điều khiển bằng tín hiệu bên ngoài do đó BEDO giảm thời gian truyền data out đến 30% so với EDO.
  15. Thông thường, FPM , EDO DRAM và được điều khiển không đồng bộ bằng cách điều khiển bộ nhớ. những gì làm cho DRAM không đồng bộ là tín hiệu điều khiển bộ nhớ RAS và CAS điều khiển trực tiếp chốt nội trong DRAM , và những tín hiệu có thể đến chân của DRAM bất cứ lúc nào . Vì thế để làm cho giao diện Dram đồng bộ thì phải làm cho các yêu cầu đến một cách điều đặn Bằng cách kết hợp tất cả các dữ liệu và điều khiển truyền nhận với một tín hiệu clock, thời gian diển ra các sự kiện dễ dự đoán và chương trình ít nghiêng tức là hệ thống có khả năng đạt được vòng quay nhanh hơn trên các yêu cầu, do đó hiệu suất thông lượng cao hơn
  16. Từ khi xuất hiện SDRAM giữa những năm 1990, đã có sự phong phú của kiến trúc DRAM. Trước BEDO DRAM không có kiến ​​trúc DRAM nào có cung cấp hiệu suất 30% lại bằng không về chi phí hoặc gần bằng 0 , giữa hiệu suất và chi phí chế tạo có mối quan hệ tuyến tính.
  17. Ví dụ như là hình sau: Đầu tiên gói address/control được đưa vào gồm toàn bộ địa chỉ hàng và địa chỉ cột, và sau đó dữ liệu được đưa vào. Hình 7.16 cho thấy một giao dịch đọc điển hình với một độ trễ tùy ý
  18. Do bus được thiết kế chỉ có một giao dịch có thể sử dụng xe buýt trong bất kỳ chu kỳ nào, điều này hạn chế khả năng làm việc đồng thời tức là nhiều việc cùng một lúc của bus. Do hạn chế này. các thiết kế ban đầu đã được RDRAM không được coi là thích hợp cho bộ nhớ chính của các máy tính trên thị trường. Và giao diện được thiết kế lại để hỗ trợ nhiều hơn về khả năng đồng thơi này. Dẫn tới sự ra đời của Rdram đồng thời.
  19. Concurrent RDRAM có hạn chế là bus chỉ mang được gói thông tin ngắn gọn do bus 1 bitq úa hẹp Do đó xuất hiện Direct Rdram khắc phục hạn chế này.
  20. Chồng chéo hoạt động vì dụ nó cho phép hàng sạc lại lập tức mà không cần phải đóng hàng, ngoài ra còn có cơ chế ghi có thể tiến hành mà không cần đóng hàng đang kích hoạt hiện tại
  21. Sram 1 transitor
  22. Sram 1 transitor
  23. Ngày nay thiết kế DRAM rất nhiều, thu hút thị trường bởi hiệu suất cao Ngành công nghiệp DRAM có xu hướng ủng hộ xây dựng các thiết kế đơn giản mà đạt được những lợi ích mong muốn. Hiện nay, DRAM thống trị trong việc thiết kế highperformance trường là DDR.
  24. Mọi hoạt động đều diễn ra theo clock
  25. - That is, all transmis-sions on the various busses (control, address, data) begin in time with one edge of the system clock the memory controller can issue other requests to other banks during those cycles that it otherwise would have been toggling CAS. Khả năng thiết lập CAS latency cho phép các bộ phận thuộc các thế hệ khác nhau với những công nghệ chế tạo khác nhau có thể hoạt động tương thích với nhau. Nhờ đó các bộ phận mixed-performance có thể dễ dàng được sủ dụng trong cùng 1 hệ thống hoặc thậm chí là trong những module tương tự
  26. that is, some data bits are transmitted on the data bus in time with the rising edge of the system clock, and other bits are transmitted with the falling edge.
  27. DQS data strobe - là tín hiệu đi kèm với dữ liệu được gửi đi, tín hiệu này ở trạng thái nghỉ nếu như không có data trên bus Xung clock này không đồng bộ với xung clock của hệ thống và luôn chạy ngay cả khi không có tín hiệu trên bus.
  28. Sử dụng Latency cố định cho từng SDRAM , đơn giản, ít linh động Thiết kế tập lệnh cho DRAM sao cho mỗi lệnh đọc theo cột thiết lập mã cụ thể cho CAS Latency mình mong muốn. Bằng cách thêm bớt các Fuse mà các nhà sản xuất có thể tạo ra một thành phần có thể có nhiều CAS Latency cho phù hợp. Cho DRAM biết tốc độ bus và đưa ra CAS Latency nhanh nhất, phù hợp với tốc độ bus đó. Có thể cho DRAM tự nhận biết hoặc bằng lệnh của Controller
  29. Cách 1 đòi hỏi DRAM phải có thêm một pin, cách 2 đòi hỏi trên DRAM phải có mạch logic để tạo và đồng bộ clock.
  30. The disadvantage of this alternative is that it requires more engineering effort than simply widening the memory bus or icreasing the number of data pins on a DRAM Có người cho rằng tăng băng thông cho cả Module thì quan trọng hơn là tăng băng thông cho DRAM
  31. Nên hướng tới việc tăng độ rộng cho băng thông , thay vì tăng tần số cho xung clock. Sử dụng phương thức Vernier để đo và tính toán những thay đổi. Đưa bộ DDL vào Memory Controller. Đưa DDL lên Module.
  32. Chapter 14 explores the FB-DIMM in more detail. Here, we will simply introduce it and present a motivation for its development.