Linux内存管理 DMA
说起DMA我们并不陌生但是实际编程中去用的人不多吧最多就是网卡驱动里的环形buffer再有就是设备的dma下面我们就分析分析.DMA用来在设备内存和内存之间直接数据交互。而无需cpu
干预
内核为了方便驱动的开发 已经提供了几个dma函数接口。dma跟硬件架构相关所以l inux关于硬件部分已经给屏蔽了有兴趣的可以深入跟踪学习.按照l inux内核对dma层的架构设计各平台dma 缓冲区映射之间的差异由内核定义的一个dma操作集include/l inux/dma-mapping.h:
来统一屏蔽实现的差异.不同差异主要来来自cache的问题Cache与dma同步问题这里不深入讨论.
另外一个常用的函数是Dma_set_mask 为了通知内核设备能够寻址的范围很多时候设备能够寻址的范围有限。
Dma映射可以分为三类
1.一致性dma映射dma_al loc_coherent 问题驱动使用的buffer 不是自身申请的而是其他模块 当驱动模块主动分配一个Dma缓冲区并且dma生存期和模块一样时
参数说明
1这个函数的返回值是缓冲的一个内核虚拟地址,它可被驱动使用
2第三个参数dma_handle 其间相关的物理地址在dma_handle中返
回
2.流式dma映射dma_map_single通常用于把内核一段buffer映射返回物理地址.如果驱动模块需要使用从别的模块传进来的虚拟地址空间作为dma缓冲区保证地址的线性cache一致性一致性api接口sync_single_for_cpu
3.分散/聚集映射scatter/gather map
Dma_map_sgs
有时候我们还需要1.回弹缓冲区bouncebuffer 当cpu侧物理地址不适合设备的dma操作的时候
2.DmA内存池一般dma映射都是单个page的整数倍如果驱动程序需要更小的一致性映射的dma缓冲区可以使用。类似于slab机制Dma_pool_create
下面我们就那网卡驱动的例子说说dma的具体应用参考l inux kernel e1000网卡drivers/net/ethernet/intel/e1000/*Ring buffer
Dma不能为高端内存一般为32默认低端内存 由于设备能够访问的地址范围有限。 设备使用物理地址而代码使用虚拟地址。
就看看如何发送数据包 e1000_main.c:e1000_xmit_frame:关于帧的发送流程这里不多说.
经过上次邻居子系统后数据帧已经到达驱动数据放在skb指定的内存里.看代码tx_ring=adapter->tx_ring;//获取发送的ring buffer
接着我们看关键代码 count=e1000_tx_map(adapter, tx_ring, skb,
first,max_per_txd,nr_frags,mss);
它做了什么呢
默认数据报文没有分片或者碎片什么的。 那么进入第一个whi le(len)
获取buffer_info=&am p;tx_ring->buffer_info[i];然后调用dma_map_single进行流式映射.即把skb->data(虚拟地址)和b uffer_i nfo->d m a 物理地址对应起来.操作两个地址等于操作同一片区域。
回到主发送函数
调用e1000_tx_queue把数据发送出去
我们看到它把刚才dma_map_singe里的映射赋值了tx_desc->buffer_addr=cpu_to_le64(buffer_info->dma);说明发送的时候是根据发送描述符来发送的。
然后操作寄存器 writel(i,hw->hw_addr+tx_ring->tdt);那么网卡就会自动读取tx desc然后把数据发送出去。
总结下流程 1. l inuxos会调用网卡的start_xmit 函数。在e1000里对应的函数是e1000_xmit_frame,2.e1000_xmit_frame又会调用e1000_tx_queue(adapter, tx_ring, tx_flags,count) 。 这里的tx_queue指的是发送Descriptor的queue。 3.e1000_tx_queue在检查了一些参数后最终调用writel(i,hw->hw_addr+tx_ring->tdt)。 这里的tx_ring->tdt中的tdt全写为tx_descriptor_tai l 。从网卡的开发手册中可以查到如果写了descriptor
tai l 那么网卡就会自动读取descriptor,然后把包发送出去。descroptor的主要内容是addr pointer和length。前者是要发送的包的起始物理地址。后者是包的长度。有了这些硬件就可以通过dma来读取包并发出去了。其他网卡也基本会用descriptor的结构。
虽然流程明白了但是还有几个点 1. tx_ring在哪初始化 2.网卡到底是如何操作映射的dma地址的把数据发送出去的txring在e1000_open的时候 调用
我们看它建立了一致性dma映射.desc是结构指针它的结构跟网卡寄存器结构有关 e1000_hw.h
我们稍微屡一下
那么网卡又是如何和dma地址关联的呢?
很明显它把dma地址写入了网卡dma寄存器。所以dma还需要网卡硬件的支持才行.
当然e1000这个网卡驱动还是相当的复杂,不过它把一致性映射和流式映射都用上了。
公司成立于2021年,专注为用户提供低价高性能云计算产品,致力于云计算应用的易用性开发,面向全球客户提供基于云计算的IT解决方案与客户服务,拥有丰富的国内BGP、三线高防、香港等优质的IDC资源。公司一直秉承”以人为本、客户为尊、永续创新”的价值观,坚持”以微笑收获友善, 以尊重收获理解,以责任收获支持,以谦卑收获成长”的行为观向客户提供全面优质的互...
Sharktech最近洛杉矶和丹佛低价配置大部分都无货了,只有荷兰机房还有少量库存,商家又提供了两款洛杉矶特价独立服务器,价格不错,CPU/内存/硬盘都是高配,1-10Gbps带宽不限流量最低129美元/月起。鲨鱼机房(Sharktech)我们也叫它SK机房,是一家成立于2003年的老牌国外主机商,提供的产品包括独立服务器租用、VPS主机等,自营机房在美国洛杉矶、丹佛、芝加哥和荷兰阿姆斯特丹等,主...
Megalayer 商家算是新晋的服务商,商家才开始的时候主要是以香港、美国独立服务器。后来有新增菲律宾机房,包括有VPS云服务器、独立服务器、站群服务器等产品。线路上有CN2优化带宽、全向带宽和国际带宽,这里有看到商家的特价方案有增加至9个,之前是四个的。在这篇文章中,我来整理看看。第一、香港服务器系列这里香港服务器会根据带宽的不同区别。我这里将香港机房的都整理到一个系列里。核心内存硬盘IP带宽...