您当前的位置:首页 > 电脑百科 > 程序开发 > 语言 > C/C++/C#

60行C代码实现一个shell

时间:2019-09-20 09:48:30  来源:  作者:

美是有目共睹的。Unix之美,稍微体会,便能得到。

1969年,Unix初始,没有fork,没有exec,没有pipe,没有 “一切皆文件” ,但是那时它已经是Unix了。它简单,可塑。

Melvin Conway在1963年的论文中叙述fork思想时就解释说并行路径要用结果来交互,也就是在汇合的join点来同步结果。这个同步点所得到的,就是一个并行进程的 输出 。

在此之外,Unix还有另一个原则,就是 组合小程序

Unix把一系列功能单一的小程序组合成一个复杂的逻辑,这个原则有以下优势:

  • 每一个小程序都很容易编写。
  • 每一个小程序可以分别完成。
  • 每一个小程序可以分别迭代修复。
  • 多个小程序可以自由组合。

这是典型的模块化思想,小到统筹佐餐烧饭,大到组成生命的嘌呤嘧啶,都不自觉地和这种模块化思想相契机,原来这就是真理。 程序尽量小,只做一件事并且做好它。

Unix程序在自身的逻辑之外对外暴露的只有输入和输出。那么 用输出连接另一个程序输入 就是一种好的方法。所谓Conway的join点对于Unix进程指的就是输出。

对外暴露的越少,程序越内聚。这是一种范式,类似RISC处理器也是抽象出仅有的load和store来和内存交互。

简单来讲,Unix程序通过输入和输出来彼此连接。下面是一幅来自Wiki的图示:

60行C代码实现一个shell

 

详见Pipeline (Unix):

https://en.wikipedia.org/wiki/Pipeline_(Unix)

Unix的另一个原则,即著名的 “一切皆文件!” 连接输出和输入的那个管道在Unix中被实现为Pipe,显然,它也是文件,一个FIFO文件。

说实话,协作几个小程序形成一个大逻辑的思想还是来自于Convey,在Convey的论文里,他称为 协程, Pile可以说是直接实现了 Convey协程 之间的交互。有关这段历史,请看:

http://www.softpanorama.org/Scripting/Piporama/history.shtml

用Pipe连接作为输出和输入连接Unix进程可以做成什么事情呢?让我们去感受一个再熟悉不过的实例,即数学式子:

 

60行C代码实现一个shell

 

 

我们把运算符加号,乘号,除号(暂不考虑括号,稍后解释为什么)这些看作是程序(事实上它们也真的是),那么类似数字3,5,7,6就是这些程序的输入了,这个式子最终需要一个输出,获得这个输出的过程如下:

  1. 数字3,5是加号程序的输入,3+5执行,它获得输出8.
  2. 第1步中的输出8连同数字7作为乘号程序的输入,8 × 7执行,获得输出56.
  3. 第2步中的输出56连同数字6作为除号的输入,…

这个数学式子的求值过程和pipe连接的Unix程序组合获得最终结果的过程完全一致。

如果你相信数学可以描述整个世界,那么Pipe连同Unix程序同样是描述这个世界的语言 。

在数学领域,程序 就是所有的运算符,加号,减号,乘号,除号,乘方,开方,求和,积分,求导…它们无一例外, 只做一件事。

在Unix看来也同样。它做的事情和下面的应该差不多,而且更多:

60行C代码实现一个shell

 

写出上面的式子中每一个数学运算符的程序并不困难,比如加号程序:

// plus.c
#include <stdio.h>
int mAIn(int argc, char **argv)
{
	int a, b;
	a = atoi(argv[1]);
	b = atoi(argv[2]);
	a = a + b;
	printf("%dn", a);
}

同样,我们可以写出除法,直到偏导的程序。然后我们通过pipe就能将它们组合成任意的数学式子。

现在谈谈Unix组合程序的具体写法,如果我们要化简薛定谔方程,我们应该如何用Unix命令写出与上述式子等价的组合程序命令行呢?我们无法像数学家手写那样随意使用括号,显然,计算机并不认识它。我们能够使用的只有两个符号:

  1. 代表具体Unix小程序的命令。
  2. Pipe符号"|"。

换句话说,我们需要写出一个 链式组合表达式。 这时就要用到前缀表达式了。

数学式子里的括号,其实它无关紧要,括号只是给人看的,它规定一些运算的优先级顺序,这叫 中缀表达式 ,一个中缀表达式可以轻松被转换为 前缀表达式,后缀表达式 ,从而消除括号。事实上,Unix的Pipe最初也面临过这样的问题,到底是中缀好呢,还是前/后缀好呢?

我们现在使用的Unix/linux命令,以cp举例:

cp $in $out

这是一个典型的前缀表达式,但是当pipe的发明者McIlroy最初引入pipe试图组合各个程序时,最初上面的命令行被建议成:

$in cp $out

就像我们的(3 + 5) × 8 一样。但是这非常不适合计算机处理的风格,计算机不得不首先扫描解析这个式子,试图:

  1. 理解 “括号括起来的要优先处理” 这句复杂的话;
  2. 区分哪些是输入,哪些是操作符…

对于式子(3 + 5) × 8 的求值,计算机更适合用一种在简单规则下非常直接的方式去 顺序执行求解,这就是前缀表达式的优势。

× 8 + 35就是(3 + 5) × 8 的前缀表达式,可以看到,没有了括号。对于pipe组合程序而言,同样适用于这个原则。于是前缀命令成了pipe组合命令的首选,现如今,我们可以用:

pro1 $stdin|pro2|pro3|pro4|...|proX $stdout

轻松组合成任意复杂的逻辑。

Pipe协同组合程序的Unix原则是一个创举,程序就是一个加工过滤器,它把一系列的输入经过自己的程序逻辑生成了一系列的输出,该输出又可以作为其它程序的输入。

在Unix/Linux中,各种shell本身就实现了这样的功能,但是为了彻底理解这种处理方式的本质,只能自己写一个才行。来写一个微小的shell吧。

再次看上面提到的Unix Pipe的处理序列:

pro1 $stdin|pro2|pro3|pro4|...|proX $stdout

如果让一个shell处理以上组合命令,要想代码量少,典型方案就是递归,然后用Pipe把这些递归调用过程给串起来,基本逻辑如下:

int exec_cmd(CMD *cmd, PIPE pipe)
{
 // 持续解析命令行,以pipe符号|分割每一个命令
 while (cmd->next) {
 PIPE pp = pipe_create();
 if (fork() > 0) {
 // 父进程递归解析下一个
 exec_cmd(cmd->next, pp);
 return 0;
 }
 // 子进程执行
 dup_in_out(pp);
 exec(cmd->cmdline);
 }
 if (fork() > 0) {
 wait_all_child();
 return 0;
 } else {
 dup_in_out(pp);
 exec(cmd->cmdline);
 }
}

按照上面的思路实现出来,大概60行左右代码就可以:

// tinysh.c
// gcc tinysh.c -o tinysh
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/wait.h>
#define CMD_BUF_LEN	512
char cmd[CMD_BUF_LEN] = {0};
void fork_and_exec(char *cmd, int pin, int pout)
{
 if (fork() == 0) {
 if (pin != -1) {
 dup2 (pin, 0);
 close(pin);
 }
 if (pout != -1) {
 dup2 (pout, 1);
 close(pout);
 }
 system(cmd);
 exit(0);
 }
	if (pin != -1)
		close(pin);
	if (pout != -1)
		close(pout);
}
int execute_cmd(char *cmd, int in)
{
	int status;
	char *p = cmd;
	int pipefd[2];
	while (*p) {
		switch (*p) {
		case '|':
			*p++ = 0;
			pipe(pipefd);
			fork_and_exec(cmd, in, pipefd[1]);
			execute_cmd(p, pipefd[0]);
			return 0;
		default:
			p++;
		}
	}
	fork_and_exec(cmd, in, -1);
	while(waitpid(-1, &status, WNOHANG) != -1);
	return 0;
}
int main(int argc, char **argv)
{
	while (1) {
		printf("tiny sh>>");
		gets(cmd);
		if (!strcmp(cmd, "q")) {
			exit(0);
		} else {
			execute_cmd(cmd, -1);
		}
	}
	return 0;
}

下面是执行tinysh的结果:

[root@10 test]# ls -l
总用量 28
-rw-r--r-- 1 root root 0 9月 1 05:39 a
-rwxr-xr-x 1 root root 9000 9月 1 05:38 a.out
-rw-r--r-- 1 root root 0 9月 1 05:39 b
-rw-r--r-- 1 root root 0 9月 1 05:39 c
-rw-r--r-- 1 root root 0 9月 1 05:39 d
-rw-r--r-- 1 root root 0 9月 1 05:39 e
-rwxr-xr-x 1 root root 9000 9月 1 05:38 tinysh
-rw-r--r-- 1 root root 1167 9月 1 05:38 tinysh.c
[root@10 test]# ./tinysh
tiny sh>>ls -l |wc -l
9
tiny sh>>cat /etc/inittab |grep init
# inittab is no longer used when using systemd.
tiny sh>>cat /etc/inittab |grep init|wc -l
1
tiny sh>>q
[root@10 test]#

递归解析的过程中fork/exec,一气呵成,这就是一个最简单shell实现。它可完成组合程序的执行并给出结果。

这个tiny shell命令解析器的逻辑可以表示如下:

60行C代码实现一个shell

 

现在,让我们用上面的tiny shell来实现式子

 

60行C代码实现一个shell

 

 

的计算,我需要写表示四则混合运算符的Unix程序,首先看加号运算符程序,将上文中plus.c改成从标准输入读取加数即可:

// plus.c
// gcc plus.c -o plus
#include <stdio.h>
#include <stdlib.h>
int main(int argc, char **argv)
{
	float a, b;
	a = atof(argv[1]);
	scanf("%f", &b);
	b = b + a;
	printf("%fn", b);
}

再看减法运算符程序代码:

// sub.c
// gcc sub.c -o sub
#include <stdio.h>
#include <stdio.h>
int main(int argc, char **argv)
{
	float a, b;
	a = atof(argv[1]);
	scanf("%f", &b);
	b = b - a;
	printf("%fn", b);
}

接下来是乘法和除法的代码:

// times.c
// gcc times.c -o times
#include <stdio.h>
#include <stdio.h>
int main(int argc, char **argv)
{
	float a, b;
	a = atof(argv[1]);
	scanf("%f", &b);
	b = b*a;
	printf("%fn", b);
}
// div.c
// gcc div.c -o div
#include <stdio.h>
#include <stdio.h>
int main(int argc, char **argv)
{
	int a, b;
	a = atof(argv[1]);
	scanf("%d", &b);
	b = b/a;
	printf("%dn", b);
}

可以看到,这些都是非常简单的程序,但是任意组合它们便可以实现任意四则运算,我们看看

60行C代码实现一个shell

 

这个如何组合。

首先在标准的Linux bash中我们试一下:

[root@10 test]# ./plus 5|./times 7|./sub 20|./div 6
3
6.000000
[root@10 test]#

计算结果显然是正确的。现在我在自己实现的tinysh中去做类似的事情:

[root@10 test]# ./tinysh
tiny sh>>./plus 5|./times 7|./sub 20|./div 6
3
6.000000
tiny sh>>q
[root@10 test]#

可以看到,tinysh的行为和标准Linux bash的行为是一致的。

简单吧,简单!无聊吧,无聊!Pipe连接了若干小程序,每一个小程序只做一件事。

如果我们的系统中没有任何shell程序,比如我们没有bash,我们只有tinysh,加上以上这4个程序,一共5个程序,就可以完成任意算式的四则混合运算。

现在我们用以上的组合Unix程序的方法试试计算下面的式子:

 

60行C代码实现一个shell

 

 

根号怎么办?

按照非Unix的编程风格,就要在程序里写函数计算开根号,但是用Unix的风格,则只需要再加个开根号的程序即可:

// sqrt.c
// gcc sqrt.c -lm -o sqrt
#include <stdio.h>
#include <stdlib.h>
#include <math.h>
int main(int argc, char *argv[])
{
	float b;
	scanf("%f", &b);
	b = sqrt(b);
	printf("%fn", b);
}

有了这个开根号的程序,结合已经有的四则运算程序,让我们的tinysh用pipe将它们串起来,就成了。好了,现在让我们计算上面的式子:

./tinysh
tiny sh>>./sqrt |./plus 3|./div 2
9
3.000000
tiny sh>>q

本文该结束了,后面要写的应该就是关于经典Unix IPC的内容了,是的,自从Pipe之后,Unix便开启了IPC,System V开始称为标准并持续引领着未来,但这是另一篇文章的话题了。

最后,来自Unix初创者之一Dennis M. Ritchie关于Unix的满满回忆,非常感人:

60行C代码实现一个shell

 

原文来自 The Evolution of the Unix Time-sharing System :http://www.read.seas.harvard.edu/~kohler/class/aosref/ritchie84evolution.pdf



Tags:shell   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
数据恢复新姿势:使用MySQL Shell进行更高效灵活的数据恢复
上篇文章(转战MySQL Shell!数据库备份新姿势,轻松搞定备份操作!)简单介绍了使用MySQL Shell进行数据库备份,本文基于上文的备份进行数据恢复演示操作。一、恢复单表因为上次备份的...【详细内容】
2023-12-19  Search: shell  点击:(115)  评论:(0)  加入收藏
对 Bash 感到厌倦?教你如何在 Linux 中更改默认 Shell
Bash 并不是唯一可供选择的 Shell。还存在数量众多的 Shell,它们都有一些独特的特性,例如 Zsh、Fish、Ksh 和 Xonsh。在你的系统中,你可以同时安装多个 Shell。要想将另一个 Sh...【详细内容】
2023-12-14  Search: shell  点击:(205)  评论:(0)  加入收藏
手把手教你写一个Shell脚本部署你的服务
我们都知道,在开发的过程中,有很多部署自己微服务的方式,其中有各种各样的不同操作,比如使用 docker 打包为镜像的方式,还有基础使用 jar 包的方式进行部署,但是呢?使用 jar 包部署...【详细内容】
2023-11-28  Search: shell  点击:(140)  评论:(0)  加入收藏
Linux 系统 Shell 中那些特殊变量
在Shell脚本中,$符号有多种含义,它通常用于表示变量、特殊变量或参数,今天介绍几个特殊的变量。 $0表示shell脚本文件本身 $1 ~ $n脚本的位置参数,表示脚本或函数的参数。例如,$1...【详细内容】
2023-11-14  Search: shell  点击:(219)  评论:(0)  加入收藏
Shell特殊变量
状态变量 变量 含义 应用场景 $? 上一条命令的返回值 判断命令的执行是否成功 $$ 用于获取当前shell环境的进程ID号 在脚本运行时将pid记录...【详细内容】
2023-11-14  Search: shell  点击:(71)  评论:(0)  加入收藏
Linux服务器超级实用的Shell脚本,建议收藏!
Shell 脚本是一种强大的工具,可以在各种领域中用于提高工作效率、简化任务和自动化常见工作流程。无论是系统管理、数据处理、任务自动化还是快速原型开发,Shell 脚本都是一种...【详细内容】
2023-11-07  Search: shell  点击:(297)  评论:(0)  加入收藏
Shell编程:命令行与脚本编程的结合
在计算机领域,Shell 是一个命令行解释器,它允许用户与操作系统进行交互。通过Shell,用户可以输入命令并执行各种任务。此外,Shell 还可以用于编写脚本,实现自动化管理和提高工作...【详细内容】
2023-09-07  Search: shell  点击:(215)  评论:(0)  加入收藏
PowerShell系列之PowerShell通过脚本方式运行笔记
上一篇文章讲解了Powershell通过交互环境运行命令的相关知识,今天给大家介绍实际工作当中使用最频繁的方式&mdash;&mdash;通过脚本运行,简单来说就是和咱们实际编写代码一样,先...【详细内容】
2023-08-28  Search: shell  点击:(293)  评论:(0)  加入收藏
shell中实时监视文件和目录变化:使用 inotifywait 命令
当您需要实时监视特定文件或目录的变化时,可以使用 inotifywait 命令。该命令通过监视文件系统事件并在事件发生时触发相应的操作来实现。以下是 inotifywait 命令的一般用...【详细内容】
2023-08-15  Search: shell  点击:(295)  评论:(0)  加入收藏
超级漂亮的 Shell
先来一张美图1 zsh 介绍1.1 Linux shellLinux/Unix 提供了很多种 Shell,为毛要这么多 Shell?难道用来炒着吃么?那我问你,你同类型的衣服怎么有那么多件?花色,质地还不一样。写程序...【详细内容】
2023-08-13  Search: shell  点击:(188)  评论:(0)  加入收藏
▌简易百科推荐
C++中的外部模板及其在当前编译文件中的实例化
在C++中,模板是一种泛型编程的工具,它允许程序员以一种类型无关的方式编写代码。然而,模板的一个常见问题是它们会导致编译时间增加,特别是在大型项目中,当多个源文件包含相同的...【详细内容】
2024-04-11  鲨鱼编程  微信公众号  Tags:C++   点击:(8)  评论:(0)  加入收藏
C++常见避坑指南
C++ 从入门到放弃?本文主要总结了在C++开发或review过程中常见易出错点做了归纳总结,希望借此能增进大家对C++的了解,减少编程出错,提升工作效率,也可以作为C++开发的避坑攻略。...【详细内容】
2024-04-03  腾讯技术工程    Tags:C++   点击:(7)  评论:(0)  加入收藏
C++ 之父反驳白宫警告:自诞生第一天起,C++ 的目标就一直是提高安全性
整理 | 郑丽媛上个月,美国白宫国家网络主任办公室(ONCD)在一份主题为《回到基础构件:通往安全软件之路》的 19 页 PDF 报告中,呼吁开发人员停止使用容易出现内存安全漏洞的编程语...【详细内容】
2024-03-25    CSDN  Tags:C++   点击:(7)  评论:(0)  加入收藏
八个 C++ 开源项目,帮助初学者进阶成长
通过参与或阅读开源项目的源代码,你可以获得丰富的实践机会。实际的项目代码比简单的教程更具挑战性,可以帮助你深入理解 C++ 的各种概念和技术。1.ThreadPool一个简单的 C++1...【详细内容】
2024-03-22  AI让生活更美好  微信公众号  Tags:C++   点击:(27)  评论:(0)  加入收藏
C# 中15个值得收藏的开源项目推荐
在开源的世界里,C# 编程语言也占有一席之地。这些开源项目涵盖了多个领域,从框架、库到工具,它们为C#开发者提供了丰富的资源和工具,帮助他们更高效地开发、测试和部署应用程序...【详细内容】
2024-03-20  程序员编程日记  微信公众号  Tags:C#   点击:(33)  评论:(0)  加入收藏
C#异步编程:Task.Run vs. async-await,掌握基础与高级用法
概述:C#中的异步编程有两主要方式:Task.Run用于在后台线程执行同步操作,而async-await更适用于清晰表达异步流程。基础用法展示了它们的简单应用,高级用法则演示了它们的结合使...【详细内容】
2024-03-09  架构师老卢  今日头条  Tags:C#   点击:(32)  评论:(0)  加入收藏
C++多线程编程:解锁性能与并发的奥秘
今天我们将深入探讨C++中的多线程编程,揭示多线程如何解锁性能潜力,提高程序的并发性能。什么是多线程?在计算机科学中,多线程是指一个进程(程序的执行实例)中的多个线程同时执行...【详细内容】
2024-02-03     AI让生活更美好  Tags:C++   点击:(73)  评论:(0)  加入收藏
C++代码优化攻略
今天我们将深入探讨C++性能优化的世界。在当今软件开发的浪潮中,高性能的代码是必不可少的。无论是开发桌面应用、移动应用,还是嵌入式系统,性能都是关键。1. 选择合适的数据结...【详细内容】
2024-01-26  AI让生活更美好  微信公众号  Tags:C++   点击:(121)  评论:(0)  加入收藏
C# 线程本地存储为什么线程间值不一样
为什么用 ThreadStatic 标记的字段,只有第一个线程拿到了初始值,其他线程都是默认值,让我能不能帮他解答一下,尼玛,我也不是神仙什么都懂,既然问了,那我试着帮他解答一下,也给后面类...【详细内容】
2024-01-26  一线码农聊技术  微信公众号  Tags:C#   点击:(74)  评论:(0)  加入收藏
C++质数检测器的设计与实现​
质数,作为数学中的一个基本概念,一直以其独特的性质吸引着众多研究者和爱好者。质数是指大于1的自然数中,除了1和它本身以外不再有其他因数的数。在实际应用中,质数检测也扮演着...【详细内容】
2024-01-15  鲨鱼编程  微信公众号  Tags:C++   点击:(122)  评论:(0)  加入收藏
站内最新
站内热门
站内头条