Tcpdump 使用总结

简介

tcpdump: dump the traffic on a network,根据使用者的定义对网络上的数据包进行截获的包分析工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤,并提供and、or、not等逻辑语句来帮助你去掉无用的信息。

命令使用

tcpdump采用命令行方式,它的命令格式为:

1
2
3
4
5
6
7
8
tcpdump [ -AdDeflLnNOpqRStuUvxX ] [ -c count ]
           [ -C file_size ] [ -F file ]
           [ -i interface ] [ -m module ] [ -M secret ]
           [ -r file ] [ -s snaplen ] [ -T type ] [ -w file ]
           [ -W filecount ]
           [ -E spi@ipaddr algo:secret, ...  ]
           [ -y datalinktype ] [ -Z user ]
           [ expression ]

tcpdump的简单选项介绍

  • -A ,以ASCII码方式显示数据包(不显示链路层头部信息),方便查看网页数据包。
  • -c count ,tcpdump将在接受到count个数据包后退出。
  • -C file-size ,(此选项用于配合-w file 选项使用) 该选项使得tcpdump 在把原始数据包直接保存到文件中之前, 检查此文件大小是否超过file-size。 如果超过了,将关闭此文件,另创一个文件继续用于原始数据包的记录。 新创建的文件名与-w选项指定的文件名一致,但文件名后多了一个数字。该数字会从1开始随着新创建文件的增多而增加。 file-size的单位是百万字节(这里指1,000,000个字节,并非1,048,576个字节, 后者是以1024字节为1k, 1024k字节为1M计算所得, 即1M=1024 * 1024 = 1,048,576)
  • -d ,以容易阅读的形式,在标准输出上打印出编排过的包匹配码, 随后tcpdump停止。(容易阅读的,通常是指以ascii码来打印一些信息。 compiled, 编排过的。 packet-matching code, 包匹配码,含义未知, 需补充)
  • -dd ,以C语言的形式打印出包匹配码。
  • -ddd ,以十进制数的形式打印出包匹配码(会在包匹配码之前有一个附加的’count’前缀)。
  • -D, 打印系统中所有tcpdump可以在其上进行抓包的网络接口。 每一个接口会打印出数字编号, 相应的接口名字, 以及可能的一个网络接口描述。 其中网络接口名字和数字编号可以用在tcpdump 的-i flag 选项(把名字或数字代替flag),来指定要在其上抓包的网络接口。 如果tcpdump编译时所依赖的libpcap库太老,-D选项不会被支持,因为其中缺乏pcap_findalldevs()函数。
  • -e ,每行的打印输出中将包括数据包的数据链路层头部信息
  • -E spi@ipaddr algo:secret , ...,可通过spi@ipaddr algo:secret 来解密IPsec ESP包。secret为用于ESP的密钥,使用ASCII字符串方式表达。 如果以0x开头,该密钥将以16进制方式读入。 除了以上的语法格式(指spi@ipaddr algo:secret), 还可以在后面添加一个语法输入文件名字供tcpdump 使用(即把spi@ipaddr algo:secret, … 中…换成一个语法文件名)。 在接收到第一个ESP包时会打开此文件, 所以最好此时把赋予tcpdump的一些特权取消(可理解为,这样防范之后,当该文件为恶意编写时,不至于造成过大损害)。
  • -f, 显示外部的IPv4地址时(非本机ip地址), 采用数字方式而不是名字。
  • -F file,使用file 文件作为过滤条件表达式的输入, 此时命令行上的输入将被忽略。
  • -i interface,指定tcpdump需要监听的接口。如果没有指定, tcpdump会从系统接口列表中搜寻编号最小的已配置好的接口(不包括 loopback 接口)。在采用2.2版本或之后版本内核的Linux 操作系统上,any这个虚拟网络接口可被用来接收所有网络接口上的数据包(这会包括目的是该网络接口的, 也包括目的不是该网络接口的)。 需要注意的是如果真实网络接口不能工作在’混杂’模式(promiscuous)下,则无法在’any’这个虚拟的网络接口上抓取其数据包。如果-D标志被指定,tcpdump会打印系统中的接口编号,而该编号就可用于此处的interface 参数。
  • -l,对标准输出进行行缓冲(使标准输出设备遇到一个换行符就马上把这行的内容打印出来)。在需要同时观察抓包打印以及保存抓包记录的时候很有用。 比如,可通过以下命令组合来达到此目的: tcpdump -l | tee dat 或者 tcpdump -l > dat & tail -f dat。(前者使用tee来把tcpdump 的输出同时放到文件dat和标准输出中, 而后者通过重定向操作’>’, 把tcpdump的输出放到dat 文件中, 同时通过tail把dat文件中的内容放到标准输出中)
  • -L,列出指定网络接口所支持的数据链路层的类型后退出。(指定接口通过 -i 来指定)
  • -m module, 通过module指定的文件装载SMI MIB模块(SMI,管理信息结构; MIB,管理信息库。可理解为,这两者用于SNMP协议数据包的抓取。此选项可多次使用, 从而为tcpdump 装载不同的MIB模块。
  • -M secret ,如果TCP segmentsTCP-MD5选项(RFC 2385),为其摘要的验证指定一个公共的密钥secret。
  • -n,不对地址(比如,主机地址,端口号)进行数字表示到名字表示的转换。
  • -N,不打印出host的域名部分。 比如,如果设置了此选现,tcpdump将会打印nic而不是nic.ddn.mil
  • -O,不启用进行包匹配时所用的优化代码。 当怀疑某些bug是由优化代码引起的,此选项将很有用。
  • -p,一般情况下,把网络接口设置为非混杂模式。 但必须注意,在特殊情况下此网络接口还是会以混杂模式来工作;从而-p的设与不设,不能当做以下选项的代名词:ether host {local-hw-add}ether broadcast(前者表示只匹配以太网地址为host 的包, 后者表示匹配以太网地址为广播地址的数据包)。
  • -q,快速(也许用’安静’更好?)打印输出。即打印很少的协议相关信息,从而输出行都比较简短。
  • -R,设定tcpdump对ESP/AH数据包的解析按照RFC1825而不是RFC1829(AH:认证头,ESP:安全负载封装,这两者会用在IP包的安全传输机制中)。 如果此选项被设置,tcpdump将不会打印出’禁止中继’域(relay prevention field)。 另外,由于ESP/AH规范中没有规定ESP/AH数据包必须拥有协议版本号域,所以tcpdump不能从收到的ESP/AH数据包中推导出协议版本号。
  • -r file,从文件file中读取包数据。如果file字段为-符号,tcpdump会从标准输入中读取包数据。
  • -S,打印TCP数据包的序列号时,使用绝对的序列号,而不是相对的序列号。
  • -s snaplen
    设置tcpdump的数据包抓取长度为snaplen,如果不设置默认将会是68字节(支持**网络接口分接头(NIT)**的SunOS系列操作系统中默认的也是最小值是96)。68字节对于IP,ICMP,TCP,UDP 协议的报文已足够,但对于名称服务(dns,nis等服务),NFS服务相关的数据包会产生包截短。 如果产生包截短这种情况,tcpdump的相应打印输出行中会出现[|proto]的标志(proto 实际会显示为被截短的数据包的相关协议层次)。 需要注意的是,采用长的抓取长度( snaplen比较大),会增加包的处理时间,并且会减少tcpdump 可缓存的数据包的数量,从而会导致数据包的丢失。 所以,在能抓取我们想要的包的前提下,抓取长度越小越好。把snaplen设置为0 意味着让tcpdump自动选择合适的长度来抓取数据包。
  • -T type 强制tcpdump按type指定的协议所描述的包结构来分析收到的数据包。 目前已知的type可取的协议为:
    • aodv (Ad-hoc On-demand Distance Vector protocol, 按需距离向量路由协议,在Ad hoc(点对点模式)网络中使用),
    • cnfp (Cisco NetFlow protocol)
    • rpc(Remote Procedure Call)
    • rtp (Real-Time Applications protocol)
    • rtcp (Real-Time Applications con-trol protocol)
    • snmp (Simple Network Management Protocol)
    • tftp (Trivial File Transfer Protocol, 碎文件协议)
    • vat (Visual Audio Tool, 可用于在internet 上进行电视电话会议的应用层协议)
    • wb (distributed White Board, 可用于网络会议的应用层协议)
  • -t ,在每行输出中不打印时间戳
  • -tt ,不对每行输出的时间进行格式处理
  • -ttt ,tcpdump 输出时,每两行打印之间会延迟一个段时间(以毫秒为单位)
  • -tttt,在每行打印的时间戳之前添加日期的打印
  • -u ,打印出未加密的NFS句柄(handle可理解为NFS中使用的文件句柄,这将包括文件夹和文件夹中的文件)
  • -U ,使得当tcpdump在使用-w选项时,其文件写入与包的保存同步。(当每个数据包被保存时,它将及时被写入文件中,而不是等文件的输出缓冲已满时才真正写入此文件)
    -U 标志在老版本的libcap库上不起作用, 因为其中缺乏pcap_cump_flush()函数。
  • -v,当分析和打印的时候,产生详细的输出。比如,包的生存时间,标识,总长度以及IP包的一些选项。 这也会打开一些附加的包完整性检测, 比如对IP或ICMP包头部的校验和。
  • -vv,产生比-v更详细的输出。
  • -vvv ,产生比-vv更详细的输出。
  • -w 把包数据直接写入文件而不进行分析和打印输出。
  • -W filecount,此选项与-C选项配合使用,这将限制可打开的文件数目,并且当文件数据超过这里设置的限制时,依次循环替代之前的文件,这相当于一个拥有filecount 个文件的文件缓冲池。 同时,该选项会使得每个文件名的开头会出现足够多并用来占位的0,这可以方便这些文件被正确的排序。
  • -x, 打印每个包的头部数据,以16进制打印出每个包的数据(但不包括连接层的头部)。总共打印的数据大小不会超过整个数据包的大小与snaplen 中的最小值。 必须要注意的是,如果高层协议数据没有snaplen这么长,并且数据链路层(比如,Ethernet层)有填充数据,则这些填充数据也会被打印。
  • -xx,打印每个包的头部数据,以16进制打印出每个包的数据,包括数据链路层的头部。
  • -X,打印每个包的头部数据,以16进制和ASCII码形式打印出每个包的数据(但不包括连接层的头部)
  • -XX,打印每个包的头部数据,以16进制和ASCII码形式打印出每个包的数据,包括数据链路层的头部。
  • -y datalinktype,设置tcpdump只捕获数据链路层协议类型是datalinktype的数据包
  • -Z user,使tcpdump放弃自己的超级权限(如果以root用户启动tcpdump,tcpdump将会有超级用户权限),并把当前tcpdump的用户ID设置为user,组ID设置为user首要所属组的ID,此选项也可在编译的时候被设置为默认打开。

tcpdump条件表达式

该表达式用于决定哪些数据包将被打印。 如果不给定条件表达式, 网络上所有被捕获的包都会被打印,否则,只有满足条件表达式的数据包被打印。 表达式由一个或多个’表达元’组成(primitive,表达元,可理解为组成表达式的基本元素)。 一个表达元通常由一个或多个修饰符(qualifiers)后跟一个名字或数字表示的id组成(即,qualifiers id)。有三种不同类型的修饰符:typedir以及proto。(参考wireshark总结) type是对包最基本的过滤条件: 即对包相关的主机, 网络, 端口的限制;dir 表示对包的传送方向的限制; proto表示对包相关的协议限制)

type修饰符指定id所代表的对象类型, id可以是名字也可以是数字。可选的对象类型有:hostnetport 以及portrange。如果不指定type修饰符,id默认的修饰符为host。

dir修饰符描述id 所对应的传输方向。可取的方向为: srcdstsrc 或 dstsrc并且dst。如果不指定dir修饰符, id 默认的修饰符为src 或 dst。(对于链路层的协议,如SLIP,以及linux下指定’any’ 设备, 并指定’cooked’抓取类型, 或其他设备类型,可以用’inbound’ 和 ‘outbount’ 修饰符来指定想要的传输方向)

proto修饰符描述id所属的协议。可选的协议有: ether, fddi, tr, wlan, ip, ip6, arp, rarp, decnet, tcp以及 udp。(ether, fddi, tr, 为物理以太网传输协议, 光纤分布数据网传输协议,以及用于路由跟踪的协议。 wlan, 无线局域网协议; ip,ip6 即通常的TCP/IP协议栈中所使用的ipv4以及ipv6网络层协议;arp, rarp 即地址解析协议,反向地址解析协议; decnet, Digital Equipment Corporation开发的, 最早用于PDP-11 机器互联的网络协议; tcp and udp, 即通常TCP/IP协议栈中的两个传输层协议)。
如果不指定proto 修饰符, 则默认为与相应type匹配的修饰符。 例如, src foo 含义是 (ip or arp or rarp) src foo (来自主机foo的ip/arp/rarp协议数据包, 默认type为host),net bar 含义是(ip or arp or rarp) net bar(来自或发往bar网络的ip/arp/rarp协议数据包),port 53 含义是 (tcp or udp) port 53(发送或接收端口为53的tcp/udp协议数据包).( 由于tcpdump 直接通过数据链路层的 BSD 数据包过滤器或 DLPI(datalink provider interface, 数据链层提供者接口)来直接获得网络数据包, 其可抓取的数据包可涵盖上层的各种协议, 包括arp, rarp, icmp(因特网控制报文协议),ip, ip6, tcp, udp, sctp(流控制传输协议).

‘fddi’(Fiber Distributed Data Interface) 实际上与’ether’ 含义一样: tcpdump 会把他们当作一种指定网络接口上的数据链路层协议. 如同ehter网(以太网), FDDI 的头部通常也会有源、目的以及包类型, 从而可以像ether网数据包一样对这些域进行过滤。此外, FDDI 头部还有其他的域, 但不能被放到表达式中用来过滤。
同样, ’tr’ 和 ‘wlan’ 也和 ’ether’ 含义一致, 上一段对fddi 的描述同样适用于tr(Token Ring) 和wlan(802.11 wireless LAN)的头部. 对于802.11 协议数据包的头部, 目的域称为DA, 源域称为 SA;而其中的 BSSID, RA, TA 域不会被检测(不能被用于包过虑表达式中).

还有其他形式的表达元,并且与上述表达元格式不同。比如: gateway, broadcast, less, greater以及算术表达式。

表达元之间还可以通过关键字and, or 以及 not 进行连接, 从而可组成比较复杂的条件表达式。
为了表示方便,同样的修饰符可以被省略,如tcp dst port ftp or ftp-data or domain 与以下的表达式含义相同tcp dst port ftp or tcp dst port ftp-data or tcp dst port domain
借助括号以及相应操作符,可把表达元组合在一起使用(由于括号是shell的特殊字符, 所以在shell脚本或终端中使用时必须对括号进行转义, 即’(’ 与’)‘需要分别表达成\(\)). 有效的操作符有:
否定操作 (!not)
与操作(&&and)
或操作(||or)
否定操作符的优先级别最高,与操作和或操作优先级别相同,并且二者的结合顺序是从左到右。要注意的是, 表达’与操作’时, 需要显式写出’and’操作符, 而不只是把前后表达元并列放置(二者中间的’and’ 操作符不可省略)。

如果一个标识符前没有关键字, 则表达式的解析过程中最近用过的关键字(往往也是从左往右距离标识符最近的关键字)将被使用,比如:
not host vs and ace
是以下表达式的精简:
not host vs and host ace
而不是not (host vs or ace)

整个条件表达式可以被当作一个单独的字符串参数也可以被当作空格分割的多个参数传入tcpdump,后者更方便些。通常,如果表达式中包含元字符(如正则表达式中的*, .以及shell中的(等字符), 最好还是使用单独字符串的方式传入。 这时,整个表达式需要被单引号括起来。多参数的传入方式中,所有参数最终还是被空格串联在一起,作为一个字符串被解析。

附录:tcpdump的表达元

以下描述中,[]代表可选,|代码选项分隔符,()代码必选。

  • [src|dst] host host,如果IPv4/v6数据包的源或目的地址是host, 则与此对应的条件表达式为真。 host前可以添加以下关键字:ip, arp, rarp, 以及 ip6。比如:ip host host,也可以表达为: ether proto \ip and host host(ip需要有\来转义,因为ip对tcpdump 来说已经是一个关键字了)。如果host 是一个拥有多个IP的主机, 那么任何一个地址都会用于包的匹配。
  • ether (dst|src|host) ehost,如果数据包的以太网源地址或目标地址是ehost, 则与此对应的条件表达式为真。 Ehost可以是/etc/ethers文件中的名字或一个数字地址。
  • gateway host,如果数据包的网关地址是host, 则与此对应的条件表达式为真。
    需要注意的是,这里的网关地址是指以太网地址,而不是IP地址。host必须是名字而不是数字,并且必须在机器的主机名-ip地址以及主机名-以太网地址两大映射关系中有其条目(前一映射关系可通过/etc/hosts文件, DNS 或 NIS得到, 而后一映射关系可通过/etc/ethers 文件得到。也就是说host 的含义是 ether host ehost 而不是 host host, 并且ehost必须是名字而不是数字。不支持IPv6。
  • [src|dst] net net,如果数据包的源或目的地址的网络号字段为net, 则与此对应的条件表达式为真。
    net 可以是从网络数据库文件/etc/networks 中的名字, 也可以是一个数字形式的网络编号。
  • [src|dst] net net mask netmask,如果数据包的源或目的地址的网络掩码与netmask匹配,则与此对应的条件表达式为真。不支持ipv6。
  • [src|dst] net net/len,如果数据包的源或目的地址的网络编号字段的比特数与len相同,则与此对应的条件表达式为真。
  • [src|dst] port port,如果数据包(包括ip/tcp, ip/udp, ip6/tcp or ip6/udp协议)的源或目的端口为port,则与此对应的条件表达式为真。port可以是一个数字也可以是一个名字(相应名字可以在/etc/services中找到该名字)。 如果使用名字, 则该名字对应的端口号和相应使用的协议都会被检查. 如果只是使用一个数字端口号,则只有相应端口号被检查(比如, dst port 513 将会使tcpdump抓取tcp协议的login 服务和udp协议的who 服务数据包, 而port domain 将会使tcpdump 抓取tcp协议的domain 服务数据包, 以及udp 协议的domain 数据包)
  • [tcp|udp] [src|dst] portrange port1-port2 如果数据包(包括ip/tcp, ip/udp, ip6/tcp or ip6/udp协议)的源或目的端口属于port1到port2这个端口范围(包括port1, port2), 则与此对应的条件表达式为真。tcpdump 对port1 和port2 解析与对port 的解析一致。
  • (less|greater) length,如果数据包的长度比length小(大)或等于length, 则与此对应的条件表达式为真.
  • (ip|ip6) proto protocol 如果数据包为ipv4数据包并且其协议类型为protocol, 则与此对应的条件表达式为真。
    Protocol可以是一个数字也可以是名字, 比如:icmp6,igmp,igrp,pim,ah,esp,vrrp,udp,or tcp。 由于tcp , udp以及icmp是tcpdump 的关键字,所以在这些协议名字之前必须要用\来进行转义(如果在C-shell 中需要用\\来进行转义)。
    注意此表达元不会把数据包中协议头链中所有协议头内容全部打印出来,只会打印指定协议的一些头部信息,比如可以用tcpdump -i eth0 'ip proto \tcp and host 192.168.3.144, 则只打印主机192.168.3.144 发出或接收的数据包中tcp 协议头所包含的信息)
  • (ip|ip6) protochain protocol,如果数据包为ip或ipv6数据包并且其协议链中包含类型为protocol协议头, 则与此对应的条件表达式为真.
  • [ether] broadcast, 如果数据包是以太网广播数据包, 则与此对应的条件表达式为真。
  • ip broadcast, 如果数据包是IPv4广播数据包, 则与此对应的条件表达式为真。
  • ether multicast,如果数据包是一个以太网多播数据包,则与此对应的条件表达式为真。
    与以下条件表达式含义一致:ether[0] & 1 != 0(可理解为, 以太网数据包中第0个字节的最低位是1,表示一个多播数据包)。
  • (ip|ip6) multicast,如果数据包是ipv4(ipv6)多播数据包, 则与此对应的条件表达式为真。
  • ether proto protocol 如果数据包属于以下以太协议类型, 则与此对应的条件表达式为真。
    protocol字段可以是一个数字或以下协议名之一:ip, ip6, arp, rarp, atalk, aarp, decnet, sca, lat, mopdl, moprc, iso, stp, ipx, 或者netbeui。
    必须要注意的是标识符也是关键字, 从而必须通过’'来进行转义。 在光纤分布式数据网络接口(其表达元形式可以是’fddi protocol arp’), 令牌环网(其表达元形式可以是’tr protocol arp’), 以及IEEE 802.11 无线局域网(其表达元形式可以是’wlan protocol arp’)中, protocol标识符来自802.2 逻辑链路控制层头, 在FDDI, Token Ring 或 802.1头中会包含此逻辑链路控制层头。当以这些网络上的相应的协议标识为过滤条件时, tcpdump只是检查LLC头部中以0x000000为组成单元标识符(OUI, 0x000000 标识一个内部以太网)的一段’SNAP格式结构’中的protocol ID 域, 而不会管包中是否有一段OUI为0x000000的’SNAP格式结构’(SNAP, SubNetwork Access Protocol,子网接入协议 )。 以下例外:
    • iso, tcpdump 会检查LLC头部中的DSAP域(Destination service Access Point, 目标服务接入点)和SSAP域(源服务接入点)。
    • stp 以及 netbeui, tcpdump 将会检查LLC 头部中的目标服务接入点(Destination service Access Point);
    • atalk。 tcpdump 将会检查LLC 头部中以0x080007 为OUI标识的’SNAP格式结构’, 并会检查AppleTalk etype域。(AppleTalk etype 是否位于SNAP格式结构中, 未知, 需补充)。 此外, 在以太网中, 对于ether proto protocol 选项, tcpdump 会为 protocol 所指定的协议检查 以太网类型域(the Ethernet type field), 但以下这些协议除外:
    • iso, stp, and netbeui, tcpdump 将会检查802.3 物理帧以及LLC 头(这两种检查与FDDI, TR, 802.11网络中的相应检查一致); (nt: 802.3, 理解为IEEE 802.3, 其为一系列IEEE 标准的集合. 此集合定义了有线以太网络中的物理层以及数据链路层的媒体接入控制子层
    • atalk,tcpdump 将会检查以太网物理帧中的AppleTalk etype 域 , 同时也会检查数据包中LLC头部中的’SNAP格式结构’。(这两种检查与FDDI, TR, 802.11网络中的相应检查一致)
    • aarp, tcpdump 将会检查AppleTalk ARP etype域, 此域或存在于以太网物理帧中, 或存在于LLC(由802.2 所定义)的’SNAP格式结构’中, 当为后者时, 该’SNAP格式结构’的OUI标识为0x000000;(802.2, 可理解为, IEEE802.2, 其中定义了逻辑链路控制层(LLC), 该层对应于OSI 网络模型中数据链路层的上层部分。 LLC 层为使用数据链路层的用户提供了一个统一的接口(通常用户是网络层). LLC层以下是媒体接入控制层(MAC层, 对应于数据链路层的下层部分).该层的实现以及工作方式会根据不同物理传输媒介的不同而有所区别(比如, 以太网, 令牌环网, 光纤分布数据接口(实际可理解为一种光纤网络), 无线局域网(802.11), 等等.)
    • ipx,tcpdump 将会检查物理以太帧中的IPX etype域, LLC头中的IPX DSAP域,无LLC头并对IPX进行了封装的802.3帧, 以及LLC 头部’SNAP格式结构’中的IPX etype 域(SNAP frame, 可理解为, LLC 头中的’SNAP格式结构’。该含义属初步理解阶段, 需补充).
  • decnet (src|dst|host) host, 如果数据包中DECNET目的地址或DECNET源地址为host, 则与此对应的条件表达式为真。 (nt:decnet, 由Digital Equipment Corporation 开发, 最早用于PDP-11 机器互联的网络协议)
  • (on|ifname) interface, 如果数据包已被标记为从指定的网络接口中接收的, 则与此对应的条件表达式为真。 (此选项只适用于被OpenBSD中pf程序做过标记的包(pf, packet filter, 可理解为OpenBSD中的防火墙程序))
  • (rnr|rulenum) num, 如果数据包已被标记为匹配PF的规则, 则与此对应的条件表达式为真。 (此选项只适用于被OpenBSD中pf程序做过标记的包(pf, packet filter, 可理解为OpenBSD中的防火墙程序))
  • reason code,如果数据包已被标记为包含PF的匹配结果代码, 则与此对应的条件表达式为真。有效的结果代码有: match, bad-offset, fragment, short, normalize, 以及memory. (此选项只适用于被OpenBSD中pf程序做过标记的包(pf, packet filter, 可理解为OpenBSD中的防火墙程序))
  • (rset|ruleset) name,如果数据包已被标记为匹配指定的规则集, 则与此对应的条件表达式为真. (此选项只适用于被OpenBSD中pf程序做过标记的包(pf, packet filter, 可理解为OpenBSD中的防火墙程序))
  • (srnr|subrulenum) num, 如果数据包已被标记为匹配指定的规则集中的特定规则(specified PF rule number, 特定规则编号, 即特定规则), 则与此对应的条件表达式为真.(此选项只适用于被OpenBSD中pf程序做过标记的包(pf, packet filter, 可理解为OpenBSD中的防火墙程序))
  • action act, 如果包被记录时PF会执行act指定的动作, 则与此对应的条件表达式为真。有效的动作有: pass, block。 (此选项只适用于被OpenBSD中pf程序做过标记的包(pf, packet filter, 可理解为OpenBSD中的防火墙程序))
  • ip, ip6, arp, rarp, atalk, aarp, decnet, iso, stp, ipx, netbeui 与以下表达元含义一致:
    ether proto p ,p是以上协议中的一个.
  • lat, moprc, mopdl 与以下表达元含义一致:
    ether proto p p是以上协议中的一个。tcpdump目前还不能分析这些协议.
  • vlan [vlan_id],如果数据包为IEEE 802.1Q VLAN 数据包, 则与此对应的条件表达式为真。(IEEE 802.1Q VLAN, 即IEEE802.1Q 虚拟网络协议, 此协议用于不同网络的之间的互联)。如果[vlan_id] 被指定, 则只有数据包含有指定的虚拟网络id(vlan_id), 则与此对应的条件表达式为真。要注意的是, 对于VLAN数据包, 在表达式中遇到的第一个vlan关键字会改变表达式中接下来关键字所对应数据包中数据的 开始位置(即解码偏移). 在VLAN网络体系中过滤数据包时, vlan [vlan_id]表达式可以被多次使用。关键字vlan每出现一次都会增加4字节过滤偏移(过滤偏移, 可理解为上面的解码偏移),如:
    vlan 100 && vlan 200 表示: 过滤封装在VLAN100中的VLAN200网络上的数据包
    vlan && vlan 300 && ip 表示: 过滤封装在VLAN300 网络中的IPv4数据包, 而VLAN300网络又被更外层的VLAN封装
  • mpls [label_num] 如果数据包为MPLS数据包, 则与此对应的条件表达式为真。 (MPLS, Multi-Protocol Label Switch, 多协议标签交换, 一种在开放的通信网上利用标签引导数据传输的技术)。 如果[label_num] 被指定, 则只有数据包含有指定的标签id(label_num), 则与此对应的条件表达式为真。 要注意的是, 对于内含MPLS信息的IP数据包(即MPLS数据包), 在表达式中遇到的第一个MPLS关键字会改变表达式中接下来关键字所对应数据包中数据的 开始位置(即解码偏移). 在MPLS网络体系中过滤数据包时, mpls [label_num]表达式可以被多次使用. 关键字mpls每出现一次都会增加 4字节过滤偏移(过滤偏移, 可理解为上面的解码偏移)如:
    mpls 100000 && mpls 1024 表示: 过滤外层标签为100000 而层标签为1024的数据包
    mpls && mpls 1024 && host 192.9.200.1 表示: 过滤发往或来自192.9.200.1的数据包, 该数据包的内层标签为1024, 且拥有一个外层标签。
  • pppoed, 如果数据包为PPP-over-Ethernet的服务器探寻数据包(Discovery packet, 其ethernet type 为0x8863),则与此对应的条件表达式为真。 (PPP-over-Ethernet, 点对点以太网承载协议, 其点对点的连接建立分为Discovery阶段(地址发现) 和 PPPoE 会话建立阶段 , discovery 数据包就是第一阶段发出来的包。 ethernet type 是以太帧里的一个字段,用来指明应用于帧数据字段的协议)
  • pppoes, 如果数据包为PPP-over-Ethernet会话数据包(ethernet type 为0x8864),则与此对应的条件表达式为真。
    要注意的是, 对于PPP-over-Ethernet会话数据包, 在表达式中遇到的第一个pppoes关键字会改变表达式中接下来关键字所对应数据包中数据的 开始位置(即解码偏移)。
    例如: pppoes && ip 表示: 过滤嵌入在PPPoE数据包中的ipv4数据包
  • tcp, udp, icmp 与以下表达元含义一致:
    ip proto p or ip6 proto p 其中p 是以上协议之一
  • iso proto protocol 如果数据包的协议类型为iso-osi协议栈中protocol协议, 则与此对应的条件表达式为真.([初解]iso-osi 网络模型中每 层的具体协议与tcp/ip相应层采用的协议不同。) protocol 可以是一个数字编号, 或以下名字中之一:
    clnp, esis, or isis (clnp, Connectionless Network Protocol, 这是OSI网络模型中网络层协议 , esis, isis 未知, 需补充)
  • clnp, esis, isis 是以下表达的缩写:
    iso proto p 其中p 是以上协议之一
  • l1, l2, iih, lsp, snp, csnp, psnp 为IS-IS PDU 类型 的缩写. (IS-IS PDU, Intermediate system to intermediate system Protocol Data Unit, 中间系统到 中间系统的协议数据单元. OSI(Open Systems Interconnection)网络由终端系统, 中间系统构成. 终端系统指路由器, 而终端系统指用户设备. 路由器形成的本地组称之为’区域’(Area)和多个区域组成一个’域’(Domain). IS-IS 提供域内或区域内的路由. l1, l2, iih, lsp, snp, csnp, psnp 表示PDU的类型, 具体含义另需补充)
  • vpi n 如果数据包为ATM数据包, 则与此对应的条件表达式为真. 对于Solaris 操作系统上的SunATM设备 , 如果数据包为ATM数据包, 并且其虚拟路径标识为n, 则与此对应的条件表达式为真. (ATM, Asychronous Transfer Mode, 实际上可理解为由ITU-T(国际电信联盟电信标准化部门)提出的一个与 TCP/IP中IP层功能等同的一系列协议, 具体协议层次另需补充)
  • vci n 如果数据包为ATM数据包, 则与此对应的条件表达式为真. 对于Solaris 操作系统上的SunATM设备 , 如果数据包为ATM数据包, 并且其虚拟通道标识为n, 则与此对应的条件表达式为真.
  • lane 如果数据包为ATM LANE 数据包, 则与此对应的条件表达式为真. 要注意的是, 如果是模拟以太网的LANE数据包或者 LANE逻辑单元控制包, 表达式中第一个lane关键字会改变表达式中随后条件的测试. 如果没有指定lane关键字, 条件测试将按照数据包中内含LLC(逻辑链路层)的ATM包来进行。
  • llc 如果数据包为ATM数据包, 则与此对应的条件表达式为真. 对于Solaris 操作系统上的SunATM设备 , 如果数据包为ATM数据包, 并且内含LLC则与此对应的条件表达式为真
  • oamf4s 如果数据包为ATM数据包, 则与此对应的条件表达式为真. 对于Solaris 操作系统上的SunATM设备 , 如果数据包为ATM数据包 并且是Segment OAM F4 信元(VPI=0 并且 VCI=3), 则与此对应的条件表达式为真。(OAM, Operation Administration and Maintenance, 操作管理和维护,可理解为:ATM网络中用于网络管理所产生的ATM信元的分类方式。ATM网络中传输单位为信元,要传输的数据终究会被分割成固定长度(53字节)的信元,(初理解: 一条物理线路可被复用, 形成虚拟路径(virtual path). 而一条虚拟路径再次被复用, 形成虚拟信道(virtual channel)). 通信双方的编址方式为:虚拟路径编号(VPI)/虚拟信道编号(VCI))。OAM F4 flow 信元又可分为segment 类和end-to-end 类, 其区别未知, 需补充.)
  • oamf4e 如果数据包为ATM数据包, 则与此对应的条件表达式为真. 对于Solaris 操作系统上的SunATM设备 , 如果数据包为ATM数据包 并且是 end-to-end OAM F4 信元(VPI=0 并且 VCI=4), 则与此对应的条件表达式为真. (nt: OAM 与 end-to-end OAM F4 在上文已有描述, 可搜索’oamf4s’来定位)
  • oamf4 如果数据包为ATM数据包, 则与此对应的条件表达式为真. 对于Solaris 操作系统上的SunATM设备 , 如果数据包为ATM数据包 并且是 end-to-end 或 segment OAM F4 信元(VPI=0 并且 VCI=3 或者 VCI=4), 则与此对应的条件表达式为真. (nt: OAM 与 end-to-end OAM F4 在上文已有描述, 可搜索’oamf4s’来定位)
  • oam 如果数据包为ATM数据包, 则与此对应的条件表达式为真. 对于Solaris 操作系统上的SunATM设备 , 如果数据包为ATM数据包 并且是 end-to-end 或 segment OAM F4 信元(VPI=0 并且 VCI=3 或者 VCI=4), 则与此对应的条件表达式为真. (nt: 此选项与oamf4重复, 需确认)
  • metac 如果数据包为ATM数据包, 则与此对应的条件表达式为真. 对于Solaris 操作系统上的SunATM设备 , 如果数据包为ATM数据包 并且是来自’元信令线路’(nt: VPI=0 并且 VCI=1, ‘元信令线路’, meta signaling circuit, 具体含义未知, 需补充), 则与此对应的条件表达式为真.
  • bcc 如果数据包为ATM数据包, 则与此对应的条件表达式为真. 对于Solaris 操作系统上的SunATM设备 , 如果数据包为ATM数据包 并且是来自’广播信令线路’(nt: VPI=0 并且 VCI=2, ‘广播信令线路’, broadcast signaling circuit, 具体含义未知, 需补充), 则与此对应的条件表达式为真.
  • sc 如果数据包为ATM数据包, 则与此对应的条件表达式为真. 对于Solaris 操作系统上的SunATM设备 , 如果数据包为ATM数据包 并且是来自’信令线路’(nt: VPI=0 并且 VCI=5, ‘信令线路’, signaling circuit, 具体含义未知, 需补充), 则与此对应的条件表达式为真.
  • ilmic 如果数据包为ATM数据包, 则与此对应的条件表达式为真. 对于Solaris 操作系统上的SunATM设备 , 如果数据包为ATM数据包 并且是来自’ILMI线路’(nt: VPI=0 并且 VCI=16, ‘ILMI’, Interim Local Management Interface , 可理解为 基于SNMP(简易网络管理协议)的用于网络管理的接口) 则与此对应的条件表达式为真.
  • connectmsg 如果数据包为ATM数据包, 则与此对应的条件表达式为真. 对于Solaris 操作系统上的SunATM设备 , 如果数据包为ATM数据包 并且是来自’信令线路’并且是Q.2931协议中规定的以下几种消息: Setup, Calling Proceeding, Connect, Connect Ack, Release, 或者Release Done. 则与此对应的条件表达式为真. (nt: Q.2931 为ITU(国际电信联盟)制定的信令协议. 其中规定了在宽带综合业务数字网络的用户接口层建立, 维护, 取消 网络连接的相关步骤.)
  • metaconnect 如果数据包为ATM数据包, 则与此对应的条件表达式为真. 对于Solaris 操作系统上的SunATM设备 , 如果数据包为ATM数据包 并且是来自’元信令线路’并且是Q.2931协议中规定的以下几种消息: Setup, Calling Proceeding, Connect, Connect Ack, Release, 或者Release Done. 则与此对应的条件表达式为真.
  • expr relop expr 如果relop 两侧的操作数(expr)满足relop 指定的关系, 则与此对应的条件表达式为真. relop 可以是以下关系操作符之一: >, <, <=, =, !=。 expr 是一个算术表达式. 此表达式中可使用整型常量(表示方式与标准C中一致), 二进制操作符(+, -, *, /, &, |, «, »), 长度操作符, 以及对特定数据包中数据的引用操作符. 要注意的是, 所有的比较操作都默认操作数是无符号的, 例如, 0x80000000 和 0xffffffff 都是大于0的(nt: 对于有符号的比较, 按照补码规则, 0xffffffff 会小于0). 如果要引用数据包中的数据, 可采用以下表达方式:
    proto [expr : size]
    proto 的取值可以是以下取值之一:ether, fddi, tr, wlan, ppp, slip, link, ip, arp, rarp, tcp, udp, icmp, ip6 或者 radio. 这指明了该引用操作所对应的协议层.(ether, fddi, wlan, tr, ppp, slip and link 对应于数据链路层, radio 对应于802.11(wlan,无线局域网)某些数据包中的附带的 “radio"头(nt: 其中描述了波特率, 数据加密等信息)).
    要注意的是, tcp, udp 等上层协议目前只能应用于网络层采用为IPv4或IPv6协议的网络(此限制会在tcpdump未来版本中 进行修改). 对于指定协议的所需数据, 其在包数据中的偏移字节由expr 来指定.
    以上表达中size 是可选的, 用来指明我们关注那部分数据段的长度(nt:通常这段数据 是数据包的一个域), 其长度可以是1, 2, 或4个字节. 如果不给定size, 默认是1个字节. 长度操作符的关键字为len, 这代码整个数据包的长度.
    例如, ’ether[0] & 1 != 0’ 将会使tcpdump 抓取所有多点广播数据包.(nt: ether[0]字节的最低位为1表示 数据包目的地址是多点广播地址). ‘ip[0] & 0xf != 5’ 对应抓取所有带有选项的 IPv4数据包. ‘ip[6:2] & 0x1fff = 0’对应抓取没被破碎的IPv4数据包或者 其片段编号为0的已破碎的IPv4数据包. 这种数据检查方式也适用于tcp和udp数据的引用, 即, tcp[0]对应于TCP 头中第一个字节, 而不是对应任何一个中间的字节.
    一些偏移以及域的取值除了可以用数字也可用名字来表达. 以下为可用的一些域(协议头中的域)的名字: icmptype (指ICMP 协议头 中type域), icmpcode (指ICMP 协议头code 域), 以及tcpflags(指TCP协议头的flags 域)
    以下为ICMP 协议头中type 域的可用取值: icmp-echoreply, icmp-unreach, icmp-sourcequench, icmp-redirect, icmp-echo, icmp-routeradvert, icmp-routersolicit, icmp-timx-ceed, icmp-paramprob, icmp-tstamp, icmp-tstampreply, icmp-ireq, icmp-ireqreply, icmp-maskreq, icmp-maskreply.
    以下为TCP 协议头中flags 域的可用取值:tcp-fin, tcp-syn, tcp-rst, tcp-push, tcp-ack, tcp-urg.

实用命令实例

默认启动

tcpdump

普通情况下,直接启动tcpdump将监视第一个网络接口上所有流过的数据包。

监视指定网络接口的数据包

tcpdump -i eth1

如果不指定网卡,默认tcpdump只会监视第一个网络接口,一般是eth0,下面的例子都没有指定网络接口。 

监视指定主机的数据包

打印所有进入或离开sundown的数据包.

tcpdump host sundown

也可以指定ip,例如截获所有210.27.48.1 的主机收到的和发出的所有的数据包

tcpdump host 210.27.48.1 

打印helios 与 hot 或者与 ace 之间通信的数据包

tcpdump host helios and \( hot or ace \)

截获主机210.27.48.1 和主机210.27.48.2 或210.27.48.3的通信

tcpdump host 210.27.48.1 and \( 210.27.48.2 or 210.27.48.3 \) 

打印ace与任何其他主机之间通信的IP 数据包, 但不包括与helios之间的数据包.

tcpdump ip host ace and not helios

如果想要获取主机210.27.48.1除了和主机210.27.48.2之外所有主机通信的ip包,使用命令:

tcpdump ip host 210.27.48.1 and ! 210.27.48.2

截获主机hostname发送的所有数据

tcpdump -i eth0 src host hostname

监视所有送到主机hostname的数据包

tcpdump -i eth0 dst host hostname

监视指定主机和端口的数据包

如果想要获取主机210.27.48.1接收或发出的telnet包,使用如下命令

tcpdump tcp port 23 and host 210.27.48.1

对本机的udp 123 端口进行监视 123 为ntp的服务端口

tcpdump udp port 123 

监视指定网络的数据包

打印本地主机与Berkeley网络上的主机之间的所有通信数据包(ucb-ether, 此处可理解为’Berkeley网络’的网络地址,此表达式最原始的含义可表达为: 打印网络地址为ucb-ether的所有数据包)

tcpdump net ucb-ether

打印所有通过网关snup的ftp数据包(注意, 表达式被单引号括起来了, 这可以防止shell对其中的括号进行错误解析)

tcpdump 'gateway snup and (port ftp or ftp-data)'

打印所有源地址或目标地址是本地主机的IP数据包
(如果本地网络通过网关连到了另一网络, 则另一网络并不能算作本地网络.(nt: 此句翻译曲折,需补充).localnet 实际使用时要真正替换成本地网络的名字)

tcpdump ip and not net localnet

监视指定协议的数据包

打印TCP会话中的的开始和结束数据包, 并且数据包的源或目的不是本地网络上的主机.(nt: localnet, 实际使用时要真正替换成本地网络的名字))

tcpdump 'tcp[tcpflags] & (tcp-syn|tcp-fin) != 0 and not src and dst net localnet'

打印所有源或目的端口是80, 网络层协议为IPv4, 并且含有数据,而不是SYN,FIN以及ACK-only等不含数据的数据包.(ipv6的版本的表达式可做练习)

tcpdump 'tcp port 80 and (((ip[2:2] - ((ip[0]&0xf)<<2)) - ((tcp[12]&0xf0)>>2)) != 0)'

(可理解为, ip[2:2]表示整个ip数据包的长度, (ip[0]&0xf)«2)表示ip数据包包头的长度(ip[0]&0xf代表包中的IHL域, 而此域的单位为32bit, 要换算成字节数需要乘以4, 即左移2. (tcp[12]&0xf0)»4 表示tcp头的长度, 此域的单位也是32bit, 换算成比特数为 ((tcp[12]&0xf0) » 4) « 2, 即 ((tcp[12]&0xf0)»2). ((ip[2:2] - ((ip[0]&0xf)«2)) - ((tcp[12]&0xf0)»2)) != 0 表示:整个ip数据包的长度减去ip头的长度,再减去tcp头的长度不为0, 这就意味着,ip数据包中确实是有数据.对于ipv6版本只需考虑ipv6头中的’Payload Length’ 与 ’tcp头的长度’的差值, 并且其中表达方式’ip[]‘需换成’ip6[]’.)

打印长度超过576字节, 并且网关地址是snup的IP数据包

tcpdump 'gateway snup and ip[2:2] > 576'

打印所有IP层广播或多播的数据包, 但不是物理以太网层的广播或多播数据报

tcpdump 'ether[0] & 1 = 0 and ip[16] >= 224'

打印除’echo request’或者’echo reply’类型以外的ICMP数据包( 比如,需要打印所有非ping 程序产生的数据包时可用到此表达式 . (nt: ’echo reuqest’ 与 ’echo reply’ 这两种类型的ICMP数据包通常由ping程序产生))

tcpdump 'icmp[icmptype] != icmp-echo and icmp[icmptype] != icmp-echoreply'

tcpdump与wireshark

Wireshark(以前是ethereal)是Windows下非常简单易用的抓包工具。但在Linux下很难找到一个好用的图形化抓包工具。 还好有Tcpdump。我们可以用Tcpdump + Wireshark 的完美组合实现:在 Linux 里抓包,然后在Windows 里分析包。

tcpdump tcp -i eth1 -t -s 0 -c 100 and dst port ! 22 and src net 192.168.1.0/24 -w ./target.cap
  1. tcp: ip icmp arp rarp 和 tcp、udp、icmp这些选项等都要放到第一个参数的位置,用来过滤数据报的类型
  2. -i eth1 : 只抓经过接口eth1的包
  3. -t : 不显示时间戳
  4. -s 0 : 抓取数据包时默认抓取长度为68字节。加上-S 0 后可以抓到完整的数据包
  5. -c 100 : 只抓取100个数据包
  6. dst port ! 22 : 不抓取目标端口是22的数据包
  7. src net 192.168.1.0/24 : 数据包的源网络地址为192.168.1.0/24
  8. -w ./target.cap : 保存成cap文件,方便用ethereal(即wireshark)分析

使用tcpdump抓取HTTP包

tcpdump  -XvvennSs 0 -i eth0 tcp[20:2]=0x4745 or tcp[20:2]=0x4854

0x4745 为"GET"前两个字母"GE”,0x4854 为"HTTP"前两个字母"HT"。
tcpdump 对截获的数据并没有进行彻底解码,数据包内的大部分内容是使用十六进制的形式直接打印输出的。显然这不利于分析网络故障,通常的解决办法是先使用带-w参数的tcpdump 截获数据并保存到文件中,然后再使用其他程序(如Wireshark)进行解码分析。当然也应该定义过滤规则,以避免捕获的数据包填满整个硬盘

输出信息含义

基本上tcpdump总的的输出格式为:系统时间 来源主机.端口 > 目标主机.端口 数据包参数
tcpdump 的输出格式与协议有关.以下简要描述了大部分常用的格式及相关例子.

链路层头

FDDI

对于FDDI网络, ‘-e’ 使tcpdump打印出指定数据包的’frame control’ 域, 源和目的地址, 以及包的长度.(frame control域 控制对包中其他域的解析)。 一般的包(比如那些IP datagrams)都是带有’async’(异步标志)的数据包,并且有取值0到7的优先级; 比如 ‘async4’就代表此包为异步数据包,并且优先级别为4. 通常认为,这些包们会内含一个 LLC包(逻辑链路控制包); 这时,如果此包 不是一个ISO datagram或所谓的SNAP包,其LLC头部将会被打印(应该是指此包内含的 LLC包的包头).

Token Ring

对于Token Ring网络(令牌环网络), ‘-e’ 使tcpdump打印出指定数据包的’frame control’和’access control’域, 以及源和目的地址, 外加包的长度. 与FDDI网络类似, 此数据包通常内含LLC数据包. 不管 是否有’-e’选项.对于此网络上的’source-routed’类型数据包(nt: 意译为:源地址被追踪的数据包,具体含义未知,需补充), 其包的源路由信息总会被打印.

802.11

对于802.11网络(WLAN,即wireless local area network), ‘-e’ 使tcpdump打印出指定数据包的’frame control域, 包头中包含的所有地址, 以及包的长度.与FDDI网络类似, 此数据包通常内含LLC数据包.
(注意: 以下的描述会假设你熟悉SLIP压缩算法 (nt:SLIP为Serial Line Internet Protocol.), 这个算法可以在 RFC-1144中找到相关的蛛丝马迹.)

SLIP

对于SLIP网络(SLIP links, 可理解为一个网络, 即通过串行线路建立的连接, 而一个简单的连接也可看成一个网络), 数据包的’direction indicator’(‘方向指示标志’)(“I"表示入, “O"表示出), 类型以及压缩信息将会被打印。包类型会被首先打印。 类型分为ip, utcp以及ctcp。 对于ip包,连接信息将不被打印(nt:SLIP连接上,ip包的连接信息可能无用或没有定义. reconfirm).对于TCP数据包, 连接标识紧接着类型表示被打印. 如果此包被压缩, 其被编码过的头部将被打印. 此时对于特殊的压缩包,会如下显示:
*S+n 或者 *SA+n, 其中n代表包的(顺序号或(顺序号和应答号))增加或减少的数目(S,SA拗口, 需再译)。 对于非特殊的压缩包,0个或更多的’改变’将会被打印.‘改变’被打印时格式如下:
‘标志’+/-/=n 包数据的长度 压缩的头部长度.
其中’标志’可以取以下值:
U(代表紧急指针), W(指缓冲窗口), A(应答), S(序列号), I(包ID),而增量表达’=n’表示被赋予新的值, +/-表示增加或减少.
比如, 以下显示了对一个外发压缩TCP数据包的打印, 这个数据包隐含一个连接标识(connection identifier); 应答号增加了6, 顺序号增加了49, 包ID号增加了6; 包数据长度为3字节(octect), 压缩头部为6字节.(nt:如此看来这应该不是一个特殊的压缩数据包).

ARP/RARP 数据包

tcpdump对Arp/rarp包的输出信息中会包含请求类型及该请求对应的参数. 显示格式简洁明了. 以下是从主机rtsg到主机csam的’rlogin’ (远程登录)过程开始阶段的数据包样例:
arp who-has csam tell rtsg
arp reply csam is-at CSAM
第一行表示:rtsg发送了一个arp数据包(nt:向全网段发送,arp数据包)以询问csam的以太网地址 Csam(nt:可从下文看出来, 是Csam)以她自己的以太网地址做了回应(在这个例子中, 以太网地址以大写的名字标识, 而internet 地址(即ip地址)以全部的小写名字标识).
如果使用tcpdump -n, 可以清晰看到以太网以及ip地址而不是名字标识:
arp who-has 128.3.254.6 tell 128.3.254.68
arp reply 128.3.254.6 is-at 02:07:01:00:01:c4
如果我们使用tcpdump -e, 则可以清晰的看到第一个数据包是全网广播的, 而第二个数据包是点对点的:
RTSG Broadcast 0806 64: arp who-has csam tell rtsg
CSAM RTSG 0806 64: arp reply csam is-at CSAM
第一个数据包表明:以arp包的源以太地址是RTSG, 目标地址是全以太网段, type域的值为16进制0806(表示ETHER_ARP(nt:arp包的类型标识)), 包的总长度为64字节.

TCP 数据包

通常tcpdump对tcp数据包的显示格式如下:
src > dst: flags data-seqno ack window urgent options

  1. src 和 dst 是源和目的IP地址以及相应的端口。
  2. flags 标志由S(SYN), F(FIN), P(PUSH, R(RST), W(ECN CWT)或者 E(ECN-Echo)组成, 单独一个.表示没有flags标识。
  3. 数据段顺序号(Data-seqno)描述了此包中数据所对应序列号空间中的一个位置
  4. Ack描述的是同一个连接,同一个方向,下一个本端应该接收的(对方应该发送的)数据片段的顺序号
  5. Window是本端可用的数据接收缓冲区的大小(也是对方发送数据时需根据这个大小来组织数据)
  6. Urg(urgent) 表示数据包中有紧急的数据
  7. options描述了tcp的一些选项, 这些选项都用尖括号来表示(如 <mss 1024>)
  8. src, dst 和 flags 这三个域总是会被显示. 其他域的显示与否依赖于tcp协议头里的信息

这是一个从trsg到csam的一个rlogin应用登录的开始阶段.

1
2
3
4
5
6
7
8
9
rtsg.1023 > csam.login: S 768512:768512(0) win 4096 <mss 1024>
csam.login > rtsg.1023: S 947648:947648(0) ack 768513 win 4096 <mss 1024>
rtsg.1023 > csam.login: . ack 1 win 4096
rtsg.1023 > csam.login: P 1:2(1) ack 1 win 4096
csam.login > rtsg.1023: . ack 2 win 4096
rtsg.1023 > csam.login: P 2:21(19) ack 1 win 4096
csam.login > rtsg.1023: P 1:2(1) ack 21 win 4077
csam.login > rtsg.1023: P 2:3(1) ack 21 win 4077 urg 1
csam.login > rtsg.1023: P 3:4(1) ack 21 win 4077 urg 1

第一行表示有一个数据包从rtsg主机的tcp端口1023发送到了csam主机的tcp端口login上(udp协议的端口和tcp协议的端 口是分别的两个空间, 虽然取值范围一致)。 S表示设置了SYN标志。 包的顺序号是768512, 并且没有包含数据。(表示格式 为:‘first:last(nbytes)’, 其含义是’此包中数据的顺序号从first开始直到last结束,不包括last。 并且总共包含nbytes的 用户数据’。) 没有捎带应答(从下文来看,第二行才是有捎带应答的数据包), 可用的接受窗口的大小为4096bytes, 并且请求端(rtsg) 的最大可接受的数据段大小是1024字节(这个信息作为请求发向应答端csam, 以便双方进一步的协商)。

Csam 向rtsg 回复了基本相同的SYN数据包, 其区别只是多了一个’ piggy-backed ack’(捎带回的ack应答, 针对rtsg的SYN数据包)。

rtsg 同样针对csam的SYN数据包回复了一ACK数据包作为应答。 ‘.‘的含义就是此包中没有标志被设置。 由于此应答包中不含有数据, 所以 包中也没有数据段序列号。 提醒! 此ACK数据包的顺序号只是一个小整数1. 有如下解释:tcpdump对于一个tcp连接上的会话, 只打印会话两端的 初始数据包的序列号,其后相应数据包只打印出与初始包序列号的差异。即初始序列号之后的序列号,可被看作此会话上当前所传数据片段在整个 要传输的数据中的’相对字节’位置(双方的第一个位置都是1, 即’相对字节’的开始编号)。’-S’将覆盖这个功能, 使数据包的原始顺序号被打印出来.

第六行的含义为:rtsg 向 csam发送了19字节的数据(字节的编号为2到20,传送方向为rtsg到csam)。 包中设置了PUSH标志。 在第7行, csam 喊到, 她已经从rtsg中收到了21以下的字节, 但不包括21编号的字节. 这些字节存放在csam的socket的接收缓冲中, 相应地, csam的接收缓冲窗口大小会减少19字节(可以从第5行和第7行win属性值的变化看出来)。 csam在第7行这个包中也向rtsg发送了一个 字节。 在第8行和第9行, csam 继续向rtsg 分别发送了两个只包含一个字节的数据包, 并且这个数据包带PUSH标志。

如果所抓到的tcp包(即这里的snapshot)太小了,以至tcpdump无法完整得到其头部数据, 这时, tcpdump会尽量解析这个不完整的头, 并把剩下不能解析的部分显示为’[|tcp]’. 如果头部含有虚假的属性信息(比如其长度属性其实比头部实际长度长或短), tcpdump会为该头部 显示’[bad opt]’。 如果头部的长度告诉我们某些选项(从下文来看,指tcp包的头部中针对ip包的一些选项, 回头再翻)会在此包中, 而真正的IP数据包的长度又不够容纳这些选项, tcpdump会显示’[bad hdr length]’.

抓取带有特殊标志的的TCP包(如SYN-ACK标志, URG-ACK标志等)。
在TCP的头部中, 有8比特(bit)用作控制位区域, 其取值为:
CWR | ECE | URG | ACK | PSH | RST | SYN | FIN (这8个位是用或的方式来组合的)
现假设我们想要监控建立一个TCP连接整个过程中所产生的数据包. 可回忆如下:TCP使用3次握手协议来建立一个新的连接; 其与此三次握手 连接顺序对应,并带有相应TCP控制标志的数据包如下:

  1. 连接发起方(Caller)发送SYN标志的数据包
  2. 接收方(Recipient)用带有SYN和ACK标志的数据包进行回应
  3. 发起方收到接收方回应后再发送带有ACK标志的数据包进行回应
 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
0 15 31
-----------------------------------------------------------------
| source port | destination port |
-----------------------------------------------------------------
| sequence number |
-----------------------------------------------------------------
| acknowledgment number |
-----------------------------------------------------------------
| HL | rsvd |C|E|U|A|P|R|S|F| window size |
-----------------------------------------------------------------
| TCP checksum | urgent pointer |
-----------------------------------------------------------------

一个TCP头部,在不包含选项数据的情况下通常占用20个字节(options 理解为选项数据)。第一行包含0到3编号的字节, 第二行包含编号4-7的字节。 如果编号从0开始算, TCP控制标志位于13字节(第四行左半部分).

1
2
3
4
5
0 7| 15| 23| 31
----------------|---------------|---------------|----------------
| HL | rsvd |C|E|U|A|P|R|S|F| window size |
----------------|---------------|---------------|----------------
| | 13th octet | | |

让我们仔细看看编号13的字节:

1
2
3
4
5
| |
|---------------|
|C|E|U|A|P|R|S|F|
|---------------|
|7 5 3 0|

这里有我们感兴趣的控制标志位。 从右往左这些位被依次编号为0到7, 从而 PSH位在3号, 而URG位在5号。
让我们看看在一个包的包头中, 如果SYN位被设置, 到底在13号字节发生了什么:

1
2
3
4
5
|C|E|U|A|P|R|S|F|
|---------------|
|0 0 0 0 0 0 1 0|
|---------------|
|7 6 5 4 3 2 1 0|

在控制段的数据中,只有比特1被置位。假设编号为13的字节是一个8位的无符号字符型,其二进制值,: 00000010,并且其10进制值为:
0*2^7 + 0*2^6 + 0*2^5 + 0*2^4 + 0*2^3 + 0*2^2 + 1*2^1 + 0*2^0 = 2
所以如果数据包头部中的SYN被置位, 那么头部中的第13个字节的值为2。表达为tcpdump能理解的关系式就是:
tcp[13] 2
从而我们可以把此关系式当作tcpdump的过滤条件, 目标就是监控只含有SYN标志的数据包:
tcpdump -i xl0 tcp[13] 2 (xl0 指网络接口, 如eth0)
现在, 假设我们需要抓取带SYN标志的数据包, 而忽略它是否包含其他标志.(只要带SYN就是我们想要的). 让我们来看看当一个含有 SYN-ACK的数据包(SYN 和 ACK 标志都有), 来到时发生了什么:

1
2
3
4
5
|C|E|U|A|P|R|S|F|
|---------------|
|0 0 0 1 0 0 1 0|
|---------------|
|7 6 5 4 3 2 1 0|

13号字节的1号和4号位被置位, 其二进制的值为: 00010010
转换成十进制就是:
0*2^7 + 0*2^6 + 0*2^5 + 1*2^4 + 0*2^3 + 0*2^2 + 1*2^1 + 0*2 = 18
现在, 却不能只用’tcp[13] 18’作为tcpdump的过滤表达式, 因为这将导致只选择含有SYN-ACK标志的数据包, 其他的都被丢弃。 把13号字节的二进制值与其他的一个数做AND操作(逻辑与)来得到SYN比特位的值。目标是:只要SYN被设置就行, 于是我们就把她与上13号字节的SYN值( 00000010).

1
2
3
4
	00010010 SYN-ACK 			   	00000010 SYN
AND 00000010 (we want SYN) 		AND 00000010 (we want SYN)
	-------- 					   	--------
= 	00000010 					=  	00000010

不管包的ACK或其他标志是否被设置, 以上的AND操作都会给我们相同的值, 其10进制表达就是2(2进制表达就是00000010)。 从而我们知道, 对于带有SYN标志的数据包, 以下的表达式的结果总是真(true):
( ( value of octet 13 ) AND ( 2 ) ) ( 2 ) (value of octet 13, 即13号字节的值)
灵感随之而来, 我们于是得到了如下的tcpdump的过滤表达式
tcpdump -i xl0 'tcp[13] & 2 2'
注意, 单引号或反斜杆(这里用的是单引号)不能省略, 这可以防止shell对&的解释或替换.

UDP 数据包

UDP 数据包的显示格式,可通过rwho这个具体应用所产生的数据包来说明:
actinide.who > broadcast.who: udp 84
其含义为:actinide主机上的端口who向broadcast主机上的端口who发送了一个udp数据包(actinide和broadcast都是指Internet地址). 这个数据包承载的用户数据为84个字节.
一些UDP服务可从数据包的源或目的端口来识别,也可从所显示的更高层协议信息来识别. 比如, Domain Name service requests(DNS 请求, 在RFC-1034/1035中), 和Sun RPC calls to NFS(对NFS服务器所发起的远程调用(即Sun RPC),在RFC-1050中有对远程调用的描述).

UDP 名称服务请求

名称服务请求有如下的格式:
src > dst: id op? flags qtype qclass name (len)
(从下文来看, 格式应该是src > dst: id op flags qtype qclass? name (len))
比如有一个实际显示为:
h2opolo.1538 > helios.domain: 3+ A? ucbvax.berkeley.edu. (37)
主机h2opolo 向helios 上运行的名称服务器查询ucbvax.berkeley.edu 的地址记录(qtype等于A). 此查询本身的id号为'3’. 符号 ‘+‘意味着递归查询标志被设置(dns服务器可向更高层dns服务器查询本服务器不包含的地址记录). 这个最终通过IP包发送的查询请求 数据长度为37字节, 其中不包括UDP和IP协议的头数据. 因为此查询操作为默认值(normal one的理解), op字段被省略. 如果op字段没被省略, 会被显示在'3’ 和’+‘之间. 同样, qclass也是默认值, C_IN, 从而也没被显示, 如果没被忽略, 她会被显示在’A’之后.

异常检查会在方括中显示出附加的域: 如果一个查询同时包含一个回应(可理解为, 对之前其他一个请求的回应), 并且此回应包含权威或附加记录段,  ancount, nscout, arcount(具体字段含义需补充) 将被显示为’[na]’, ‘[nn]’, ‘[nau]’, 其中n代表合适的计数. 如果包中以下 回应位(比如AA位, RA位, rcode位), 或者字节2或3中任何一个’必须为0’的位被置位(设置为1), ‘[b2&3]=x’ 将被显示, 其中x表示 头部字节2与字节3进行与操作后的值.

UDP 名称服务应答

对名称服务应答的数据包,tcpdump会有如下的显示格式
src > dst: id op rcode flags a/n/au type class data (len)
比如具体显示如下:
helios.domain > h2opolo.1538: 3 3/3/7 A 128.32.137.3 (273)
helios.domain > h2opolo.1537: 2 NXDomain* 0/1/0 (97)
第一行表示: helios 对h2opolo 所发送的3号查询请求回应了3条回答记录(answer records), 3条名称服务器记录, 以及7条附加的记录. 第一个回答记录(3个回答记录中的第一个)类型为A(表示地址), 其数据为internet地址128.32.137.3. 此回应UDP数据包, 包含273字节的数据(不包含UPD和IP的头部数据). op字段和rcode字段被忽略(op的实际值为Query, rcode, 即 response code的实际值为NoError), 同样被忽略的字段还有class 字段(其值为C_IN, 这也是A类型记录默认取值)
第二行表示: helios 对h2opolo 所发送的2号查询请求做了回应. 回应中, rcode编码为NXDomain(表示不存在的域)), 没有回答记录, 但包含一个名称服务器记录, 不包含权威服务器记录(从上文来看, 此处的authority records 就是上文中对应的additional records). ‘*‘表示权威服务器回答标志被设置(从而additional records就表示的是authority records). 由于没有回答记录, type, class, data字段都被忽略.
flag字段还有可能出现其他一些字符, 比如’-’(表示可递归地查询, 即RA 标志没有被设置), ‘|’(表示被截断的消息, 即TC 标志 被置位). 如果应答(可理解为, 包含名称服务应答的UDP数据包, tcpdump知道这类数据包该怎样解析其数据)的’question’段一个条 目(entry)都不包含(每个条目的含义, 需补充),’[nq]’ 会被打印出来.
要注意的是:名称服务器的请求和应答数据量比较大, 而默认的68字节的抓取长度(nt: snaplen, 可理解为tcpdump的一个设置选项)可能不足以抓取 数据包的全部内容. 如果你真的需要仔细查看名称服务器的负载, 可以通过tcpdump 的-s 选项来扩大snaplen值.

SMB/CIFS 解码

tcpdump 已可以对SMB/CIFS/NBT相关应用的数据包内容进行解码(分别为’Server Message Block Common’, ‘Internet File System’ ‘在TCP/IP上实现的网络协议NETBIOS的简称’. 这几个服务通常使用UDP的137/138以及TCP的139端口). 原来的对IPX和NetBEUI SMB数据包的 解码能力依然可以被使用(NetBEUI为NETBIOS的增强版本).
tcpdump默认只按照最简约模式对相应数据包进行解码, 如果我们想要详尽的解码信息可以使用其-v 启动选现. 要注意的是, -v 会产生非常详细的信息,比如对单一的一个SMB数据包, 将产生一屏幕或更多的信息, 所以此选项, 确有需要才使用.
关于SMB数据包格式的信息, 以及每个域的含义可以参看www.cifs.org 或者samba.org 镜像站点的pub/samba/specs/ 目录. linux 上的SMB 补丁 (patch)由 Andrew Tridgell (tridge@samba.org)提供.

NFS 请求和回应

tcpdump对Sun NFS(网络文件系统)请求和回应的UDP数据包有如下格式的打印输出:

1
2
src.xid > dst.nfs: len op args
src.nfs > dst.xid: reply stat len op results

以下是一组具体的输出数据

1
2
3
4
5
6
sushi.6709 > wrl.nfs: 112 readlink fh 21,24/10.73165
wrl.nfs > sushi.6709: reply ok 40 readlink "../var"
sushi.201b > wrl.nfs:
144 lookup fh 9,74/4096.6878 "xcolors"
wrl.nfs > sushi.201b:
reply ok 128 lookup fh 9,74/4134.3150

第一行输出表明: 主机sushi向主机wrl发送了一个’交换请求’(transaction), 此请求的id为6709(注意, 主机名字后是交换 请求id号, 而不是源端口号). 此请求数据为112字节, 其中不包括UDP和IP头部的长度. 操作类型为readlink(nt: 即此操作为读符号链接操作), 操作参数为fh 21,24/10.73165(nt: 可按实际运行环境, 解析如下, fd 表示描述的为文件句柄, 21,24 表示此句柄所对应设 备的主/从设备号对, 10表示此句柄所对应的i节点编号(每个文件都会在操作系统中对应一个i节点, 限于unix类系统中), 73165是一个编号(可理解为标识此请求的一个随机数, 具体含义需补充)).
第二行中, wrl 做了’ok’的回应, 并且在results 字段中返回了sushi想要读的符号连接的真实目录(nt: 即sushi要求读的符号连接其实是一个目录).
第三行表明: sushi 再次请求 wrl 在’fh 9,74/4096.6878’所描述的目录中查找’xcolors’文件. 需要注意的是, 每行所显示的数据含义依赖于其中op字段的 类型(nt: 不同op 所对应args 含义不相同), 其格式遵循NFS 协议, 追求简洁明了.
如果tcpdump 的-v选项(详细打印选项) 被设置, 附加的信息将被显示. 比如:

1
2
3
4
sushi.1372a > wrl.nfs:
148 read fh 21,11/12.195 8192 bytes @ 24576
wrl.nfs > sushi.1372a:
reply ok 1472 read REG 100664 ids 417/0 sz 29388

(-v 选项一般还会打印出IP头部的TTL, ID, length, 以及fragmentation 域, 但在此例中, 都略过了(可理解为,简洁起见, 做了删减)) 在第一行, sushi 请求wrl 从文件 21,11/12.195(格式在上面有描述)中, 自偏移24576字节处开始, 读取8192字节数据. Wrl 回应读取成功; 由于第二行只是回应请求的开头片段, 所以只包含1472字节(其他的数据将在接着的reply片段中到来, 但这些数据包不会再有NFS 头, 甚至UDP头信息也为空(源和目的应该要有), 这将导致这些片段不能满足过滤条件, 从而没有被打印). -v 选项除了显示文件数据信息, 还会显示 附加显示文件属性信息: file type(文件类型, ‘‘REG’’ 表示普通文件), file mode(文件存取模式, 8进制表示的), uid 和gid(文件属主和 组属主), file size (文件大小).
如果-v 标志被多次重复给出(如-vv), tcpdump会显示更加详细的信息.
必须要注意的是, NFS 请求包中数据比较多, 如果tcpdump 的snaplen(nt: 抓取长度) 取太短将不能显示其详细信息. 可使用 ‘-s 192’来增加snaplen, 这可用以监测NFS应用的网络负载(traffic).
NFS 的回应包并不严格的紧随之前相应的请求包(nt: RPC operation). 从而, tcpdump 会跟踪最近收到的一系列请求包, 再通过其 交换序号(transaction ID)与相应请求包相匹配. 这可能产生一个问题, 如果回应包来得太迟, 超出tcpdump 对相应请求包的跟踪范围, 该回应包将不能被分析.

AFS 请求和回应

AFS(Andrew 文件系统, Transarc , 未知, 需补充)请求和回应有如下的答应

1
2
3
4
5
6
7
src.sport > dst.dport: rx packet-type
src.sport > dst.dport: rx packet-type service call call-name args
src.sport > dst.dport: rx packet-type service reply call-name args
elvis.7001 > pike.afsfs:
rx data fs call rename old fid 536876964/1/1 ".newsrc.new"
new fid 536876964/1/1 ".newsrc"
pike.afsfs > elvis.7001: rx data fs reply rename

在第一行, 主机elvis 向pike 发送了一个RX数据包. 这是一个对于文件服务的请求数据包(RX data packet, 发送数据包 , 可理解为发送包过去, 从而请求对方的服务), 这也是一个RPC 调用的开始(RPC, remote procedure call). 此RPC 请求pike 执行rename(重命名) 操作, 并指定了相关的参数: 原目录描述符为536876964/1/1, 原文件名为 ‘.newsrc.new’, 新目录描述符为536876964/1/1, 新文件名为 ‘.newsrc’. 主机pike 对此rename操作的RPC请求作了回应(回应表示rename操作成功, 因为回应的是包含数据内容的包而不是异常包).

一般来说, 所有的’AFS RPC’请求被显示时, 会被冠以一个名字( 即decode, 解码), 这个名字往往就是RPC请求的操作名. 并且, 这些RPC请求的部分参数在显示时, 也会被冠以一个名字(即decode, 解码, 一般来说也是取名也很直接, 比如, 一个interesting 参数, 显示的时候就会直接是’interesting’, 含义拗口, 需再翻).

这种显示格式的设计初衷为’一看就懂’, 但对于不熟悉AFS 和 RX 工作原理的人可能不是很 有用(还是不用管, 书面吓吓你的, 往下看就行).

如果 -v(详细)标志被重复给出(如-vv), tcpdump 会打印出确认包(可理解为, 与应答包有区别的包)以及附加头部信息 (可理解为, 所有包, 而不仅仅是确认包的附加头部信息), 比如, RX call ID(请求包中’请求调用’的ID), call number(‘请求调用’的编号), sequence number(nt: 包顺序号), serial number(可理解为与包中数据相关的另一个顺信号, 具体含义需补充), 请求包的标识. (接下来一段为重复描述, 所以略去了), 此外确认包中的MTU协商信息也会被打印出来(确认包为相对于请求包的确认包, Maximum Transmission Unit, 最大传输单元).

如果 -v 选项被重复了三次(如-vvv), 那么AFS应用类型数据包的’安全索引’(‘security index’)以及’服务索引’(‘service id’)将会 被打印.

对于表示异常的数据包(abort packet, 可理解为, 此包就是用来通知接受者某种异常已发生), tcpdump 会打印出错误号(error codes). 但对于Ubik beacon packets(Ubik 灯塔指示包, Ubik可理解为特殊的通信协议, beacon packets, 灯塔数据包, 可理解为指明通信中 关键信息的一些数据包), 错误号不会被打印, 因为对于Ubik 协议, 异常数据包不是表示错误, 相反却是表示一种肯定应答(即, yes vote).

AFS 请求数据量大, 参数也多, 所以要求tcpdump的 snaplen 比较大, 一般可通过启动tcpdump时设置选项’-s 256’ 来增大snaplen, 以 监测AFS 应用通信负载.

AFS 回应包并不显示标识RPC 属于何种远程调用. 从而, tcpdump 会跟踪最近一段时间内的请求包, 并通过call number(调用编号), service ID (服务索引) 来匹配收到的回应包. 如果回应包不是针对最近一段时间内的请求包, tcpdump将无法解析该包.

KIP AppleTalk协议

(DDP in UDP可理解为, DDP, The AppleTalk Data Delivery Protocol, 相当于支持KIP AppleTalk协议栈的网络层协议, 而DDP本身又是通过UDP来传输的, 即在UDP上实现的用于其他网络的网络层,KIP AppleTalk是苹果公司开发的整套网络协议栈).

AppleTalk DDP 数据包被封装在UDP数据包中, 其解封装(相当于解码)和相应信息的转储也遵循DDP 包规则. (encapsulate, 封装, 相当于编码, de-encapsulate, 解封装, 相当于解码, dump, 转储, 通常就是指对其信息进行打印).
/etc/atalk.names 文件中包含了AppleTalk 网络和节点的数字标识到名称的对应关系. 其文件格式通常如下所示:

1
2
3
4
number name
1.254 ether
16.1 icsd-net
1.254.110 ace

头两行表示有两个AppleTalk 网络. 第三行给出了特定网络上的主机(一个主机会用3个字节来标识, 而一个网络的标识通常只有两个字节, 这也是两者标识的主要区别)(1.254.110 可理解为ether网络上的ace主机). 标识与其对应的名字之间必须要用空白分开. 除了以上内容, /etc/atalk.names中还包含空行以及注释行(以’#‘开始的行).
AppleTalk 完整网络地址将以如下格式显示:
net.host.port
以下为一段具体显示:

1
2
3
144.1.209.2 > icsd-net.112.220
office.2 > icsd-net.112.220
jssmag.149.235 > icsd-net.2

(如果/etc/atalk.names 文件不存在, 或者没有相应AppleTalk 主机/网络的条目, 数据包的网络地址将以数字形式显示).

在第一行中, 网络144.1上的节点209通过2端口,向网络icsd-net上监听在220端口的112节点发送了一个NBP应用数据包 (NBP, name binding protocol, 名称绑定协议, 从数据来看, NBP服务器会在端口2提供此服务. ‘DDP port 2’ 可理解为’DDP 对应传输层的端口2’, DDP本身没有端口的概念, 这点未确定, 需补充).
第二行与第一行类似, 只是源的全部地址可用’office’进行标识.
第三行表示: jssmag网络上的149节点通过235向icsd-net网络上的所有节点的2端口(NBP端口)发送了数据包.(需要注意的是, 在AppleTalk 网络中如果地址中没有节点, 则表示广播地址, 从而节点标识和网络标识最好在/etc/atalk.names有所区别. nt: 否则一个标识x.port 无法确定x是指一个网络上所有主机的port口还是指定主机x的port口).

tcpdump 可解析NBP (名称绑定协议) and ATP (AppleTalk传输协议)数据包, 对于其他应用层的协议, 只会打印出相应协议名字( 如果此协议没有注册一个通用名字, 只会打印其协议号)以及数据包的大小.
NBP 数据包会按照如下格式显示:

1
2
3
icsd-net.112.220 > jssmag.2: nbp-lkup 190: "=:LaserWriter@*"
jssmag.209.2 > icsd-net.112.220: nbp-reply 190: "RM1140:LaserWriter@*" 250
techpit.2 > icsd-net.112.220: nbp-reply 190: "techpit:LaserWriter@*" 186

第一行表示: 网络icsd-net 中的节点112 通过220端口向网络jssmag 中所有节点的端口2发送了对’LaserWriter’的名称查询请求( 此处名称可理解为一个资源的名称, 比如打印机). 此查询请求的序列号为190.
第二行表示: 网络jssmag 中的节点209 通过2端口向icsd-net.112节点的端口220进行了回应: 我有’LaserWriter’资源, 其资源名称 为’RM1140’, 并且在端口250上提供改资源的服务. 此回应的序列号为190, 对应之前查询的序列号.
第三行也是对第一行请求的回应: 节点techpit 通过2端口向icsd-net.112节点的端口220进行了回应:我有’LaserWriter’资源, 其资源名称 为’techpit’, 并且在端口186上提供改资源的服务. 此回应的序列号为190, 对应之前查询的序列号.
ATP 数据包的显示格式如下:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
jssmag.209.165 > helios.132: atp-req 12266<0-7> 0xae030001
helios.132 > jssmag.209.165: atp-resp 12266:0 (512) 0xae040000
helios.132 > jssmag.209.165: atp-resp 12266:1 (512) 0xae040000
helios.132 > jssmag.209.165: atp-resp 12266:2 (512) 0xae040000
helios.132 > jssmag.209.165: atp-resp 12266:3 (512) 0xae040000
helios.132 > jssmag.209.165: atp-resp 12266:5 (512) 0xae040000
helios.132 > jssmag.209.165: atp-resp 12266:6 (512) 0xae040000
helios.132 > jssmag.209.165: atp-resp*12266:7 (512) 0xae040000
jssmag.209.165 > helios.132: atp-req 12266<3,5> 0xae030001
helios.132 > jssmag.209.165: atp-resp 12266:3 (512) 0xae040000
helios.132 > jssmag.209.165: atp-resp 12266:5 (512) 0xae040000
jssmag.209.165 > helios.132: atp-rel 12266<0-7> 0xae030001
jssmag.209.133 > helios.132: atp-req* 12267<0-7> 0xae030002

第一行表示节点 Jssmag.209 向节点helios 发送了一个会话编号为12266的请求包, 请求helios 回应8个数据包(这8个数据包的顺序号为0-7(顺序号与会话编号不同, 后者为一次完整传输的编号, 前者为该传输中每个数据包的编号. transaction, 会话, 通常也被叫做传输)). 行尾的16进制数字表示 该请求包中’userdata’域的值(从下文来看, 这并没有把所有用户数据都打印出来 ).

Helios 回应了8个512字节的数据包. 跟在会话编号(12266)后的数字表示该数据包在该会话中的顺序号. 括号中的数字表示该数据包中数据的大小, 这不包括atp 的头部. 在顺序号为7数据包(第8行)外带了一个’*‘号, 表示该数据包的EOM 标志被设置了.(EOM, End Of Media, 可理解为, 表示一次会话的数据回应完毕).

接下来的第9行表示, Jssmag.209 又向helios 提出了请求: 顺序号为3以及5的数据包请重新传送. Helios 收到这个 请求后重新发送了这个两个数据包, jssmag.209 再次收到这两个数据包之后, 主动结束(release)了此会话.

在最后一行, jssmag.209 向helios 发送了开始下一次会话的请求包. 请求包中的’*‘表示该包的XO 标志没有被设置. (XO, exactly once, 可理解为在该会话中, 数据包在接受方只被精确地处理一次, 就算对方重复传送了该数据包, 接收方也只会处理一次, 这需要用到特别设计的数据包接收和处理机制).

IP 数据包破碎

碎片IP数据包(即一个大的IP数据包破碎后生成的小IP数据包)有如下两种显示格式:
(frag id:size@offset+)
(frag id:size@offset)
(第一种格式表示, 此碎片之后还有后续碎片. 第二种格式表示, 此碎片为最后一个碎片)
id表示破碎编号(从下文来看, 会为每个要破碎的大IP包分配一个破碎编号, 以便区分每个小碎片是否由同一数据包破碎而来). size 表示此碎片的大小,不包含碎片头部数据。offset表示此碎片所含数据在原始整个IP包中的偏移((从下文来看, 一个IP数据包是作为一个整体被破碎的, 包括头和数据, 而不只是数据被分割).

每个碎片都会使tcpdump产生相应的输出打印. 第一个碎片包含了高层协议的头数据(从下文来看, 被破碎IP数据包中相应tcp头以及 IP头都放在了第一个碎片中 ), 从而tcpdump会针对第一个碎片显示这些信息, 并接着显示此碎片本身的信息. 其后的一些碎片并不包含 高层协议头信息, 从而只会在显示源和目的之后显示碎片本身的信息. 以下有一个例子: 这是一个从arizona.edu 到lbl-rtsg.arpa 途经CSNET网络(CSNET connection 可理解为建立在CSNET 网络上的连接)的ftp应用通信片段:
arizona.ftp-data > rtsg.1170: . 1024:1332(308) ack 1 win 4096 (frag 595a:328@0+)
arizona > rtsg: (frag 595a:204@328)
rtsg.1170 > arizona.ftp-data: . ack 1536 win 2560

有几点值得注意:

  1. 第二行的打印中, 地址后面没有端口号. 这是因为TCP协议信息都放到了第一个碎片中, 当显示第二个碎片时, 我们无法知道此碎片所对应TCP包的顺序号.
  2. 从第一行的信息中, 可以发现arizona需要向rtsg发送308字节的用户数据, 而事实是, 相应IP包经破碎后会总共产生512字节 数据(第一个碎片包含308字节的数据, 第二个碎片包含204个字节的数据, 这超过了308字节). 如果你在查找数据包的顺序号空间中的 一些空洞(hole,空洞, 指数据包之间的顺序号没有上下衔接上), 512这个数据就足够使你迷茫一阵(其实只要关注308就行, 不必关注破碎后的数据总量).
    一个数据包(指IP数据包)如果带有非IP破碎标志, 则显示时会在最后显示’(DF)’。(意味着此IP包没有被破碎过).

时间戳

tcpdump的所有输出打印行中都会默认包含时间戳信息,时间戳信息的显示格式如下:
hh:mm:ss.frac (小时:分钟:秒.(frac未知, 需补充))
此时间戳的精度与内核时间精度一致,反映的是内核第一次看到对应数据包的时间
而数据包从物理线路传递到内核的时间, 以及内核花费在此包上的中断处理时间都没有算进来

原文链接

0%