[공룡책🦖] 운영체제란?

설기똥꼬 2023. 6. 27. 11:01

2023. 6. 27. 11:01

본 포스팅은 공룡책으로 불리는 Abraham Silberschatz, Peter B. Galvin, Greg Gagne의 『Operating System Concept 10th』 기반으로 정리한 글입니다.

운영체제

Operating system, 컴퓨터 하드웨어를 관리하는 소프트웨어
사용자가 편리하고 효율적으로 프로그램을 실행할 수 있는 환경을 제공

운영체제는 자동차부터 스마트폰, PC, 클라우드 컴퓨팅 환경까지 어느 곳에나 존재한다.

따라서 현대 컴퓨팅 환경에서 OS의 역할을 탐구하기 위해 먼저 컴퓨터 하드웨어의 구성과 구조를 이해하는 것이 중요하다.

필요 기반 지식으로 CPU, 메모리 및 I/O 장치, 저장장치가 포함된다.

컴퓨터 시스템

컴퓨터 : 정보를 처리하는 기계

정보

불확실성을 측정해서 수치적으로 표현한 것 l(X) = -log2P(X)
정보의 최소 단위 bit (binary digit)

What Operating Systems Do

컴퓨터 시스템의 네가지 구성 요소

HW
OS
application program
User

1) 하드웨어 HW

하드웨어는 중앙 처리 장치(CPU), 메모리 및 입출력(I/O) 장치로 구성되어 시스템의 기본 컴퓨팅 리소스를 제공한다.

2) 운영체제 OS

하드웨어 제어와 다양한 응용 프로그램 간의 하드웨어 사용을 제어하고 조정하는 역할을 한다.

3) 응용 프로그램 application program

응용 프로그램이란 워드 프로세서, 스프레드시트, 컴파일러, 웹 브라우저 등을 말하며 사용자의 계산 문제를 해결하기 위해 이들 자원이 어떻게 사용될지를 정의한다.

4) 사용자 User

사용자 관점에서의 운영체제

한 사용자가 리소스를 독점하도록 설계되어있다.

사용자가 수행하는 작업을 최대화하며, 대부분이 Resource utilization을 위해 설계된다.

컴퓨터에 대한 사용자의 관점은 인터페이스에 따라 달라진다.

시스템 관점에서의 운영체제

운영체제는 하드웨어와 가장 밀접하게 연관된 프로그램으로, 자원 할당자(resource allocator)로 볼 수 있다.

자원에 대해 서로 상충되는 많은 요청들이 있으므로 운영체제는 컴퓨터 시스템을 효율적이고 공정하게 운영할 수 있도록 어느 요청에 자원을 할당할 지를 결정해야 한다.

또한 제어프로그램으로도 볼 수 있다.

오류 및 부적절한 사용을 방지하기 위해 사용자 프로그램을 관리한다. 또한 I/O 장치의 작동 및 제어를 관리한다.

다시 한번 운영체제에 대한 정의를 내려보자.

일반적으로 운영체제에 대한 적합한 정의는 없다.

운영체제는 유용한 컴퓨팅 시스템을 만드는 문제를 해결할 수 있는 합리적인 방법을 제공하기 때문에 존재한다.

컴퓨팅 시스템의 기본 목표는 프로그램을 실행하고 사용자의 문제를 더욱 쉽게 해결할 수 있게 하는것인데, 하드웨어만으로는 쉽지 않으므로 응용 프로그램이 개발되는 것이다.

그런데 이러한 프로그램에는 입출력 장치 제어와 같은 특정 공통 작업이 필요하고, 이런 기능은 운영체제라는 하나의 소프트웨어로 통합된다.

보다 일반적인 정의는, 운영체제는 컴퓨터에서 항상 실행되는 프로그램이다.

일반적으로 커널이라고 한다.

컴퓨터 시스템의 구성 (Computer-System Organization)

현대의 범용 컴퓨터 시스템은 하나 이상의 CPU와 Device Controller로 구성되며 공유 메모리 사이 액세스를 제공하는 공통 버스를 통해 연결된 여러 장치 컨트롤러로 구성된다.

일반적인 컴퓨터 시스템 구성

구성 요소 (CPU, Device Controller)
- 디바이스 컨트롤러 : 일부 로컬 버퍼 스토리지와 특수 목적 레지스터 집합을 유지, 관리
- CPU와 디바이스 컨트롤러는 메모리 사이클에 대한 경쟁을 하며 병렬로 실행이 가능하다.
시스템 버스
- 구성요소 <=> 공유 메모리
공유 메모리

OS는 각 device controller(장치 측면)에 대해서 device driver(OS 측면)라는 장치 제어 프로그램을 가진다.
- device controller는 local buffer storage와 refister의 집합을 가진다.
CPU는 device controller를 통해 device에 I/O 명령을 내린다.
device controller는 interrupt를 통해 CPU에게 실행이 끝났음을 알린다.

시스템 작동 방식 : 1) 인터럽트 -> 2) 스토리지 구조 -> 3) I/O 구조

인터럽트 (Interrupts)

인터럽트는 운영체제에서 하드웨어가 상호작용하는 방식의 핵심 부분이다.

CPU가 인터럽트되면 하던 일을 멈추고 즉시 서비스 루틴의 시작 주소로 이동한다. 이후 작업이 완료되면 CPU는 중단되었던 연산을 제거한다.

CPU와 I/O device가 통신하는 방법으로, HW는 언제나 interrupt trigger할 수 있다.

bus를 통해서 CPU에 신호를 전달한다,

I/O 작업 수행 방식

디바이스 드라이버가 디바이스 컨트롤러에 적절한 레지스터를 로드한다.
디바이스 컨트롤러는 레지스터의 내용을 검사하여 수행 작업을 결정한다.
디바이스 컨트롤러는 장치에서 로컬 버퍼로 데이터 전송을 시작한다.
데이터 전송이 완료되면 디바이스 컨트롤러는 디바이스 드라이버에게 작업이 완료되었음을 알린다. 이때 디바이스 컨트롤러에서 디바이스 드라이버에게 작업 완료를 알리는 역할을 하는 것이 인터럽트이다.
이후 디바이스 드라이버는 읽으려는 데이터의 포인터 또는 상태 정보를 반환한다.

인터럽트 작동 방식

인터럽트별 핸들러 호출
포인터 테이블을 사용하여 인터럽트 루틴 진행
- 속도 향상, 중간 과정 필요 X
- 포인터 테이블: 인터럽트 서비스 루틴의 주소 보유
인터럽트 벡터(테이블) - 인터럽트 요청 번호 인덱싱
인터럽트 핸들러 루틴으로 이동
해당 인덱스 주소에서 서비스 시작
- 이때 인터럽트 핸들러는 작동 중의 모든 상태 저장 → 처리 수행 → 상태 복원 수행
작업이 모두 완료되면 복귀 명령을 실행하여 CPU를 인터럽트 실행 이전 상태로 복원

인터럽트 아키텍처는 인터럽트 처리 전 상태로 복원할 수 있도록 인터럽트된 상태 정보를 저장한다.

이후, 인터럽트가 서비스된 후 이전 리턴 주소로 돌아가 인터럽트가 발생하지 않은 것처럼 복원하고 이전의 연산을 재개한다.

Storage Structure

커널은 실행기(Executor)를 통해 프로그램을 실행시킨다. 실행기는 기억장치(Storage)에서 exe파일(Windows의 경우)을 가져오고, 커널이 이것을 메모리에 할당해 실행시킨다.

즉, 모든 program은 반드시 main memory에 올라야만 실행될 수 있다. 하지만 main memory는 DRAM으로 구현하여 휘발성이고 용량이 작기 때문에 별도의 저장장치가 필요하다.

현대 컴퓨터 시스템은 기본적으로 폰 노이만 구조를 따른다.

폰노이만 아키텍처 (von Neumann architecture)

전형적인 시작-실행 사이클
- fetch & execute
메모리에서 명령어 레지스터, 데이터 레지스터 사용
- instruction register

Storage Hierarchy

storage system은 여러개의 hierarchy로 구성
- 용량과 속도에 따라 계층 구조 구성
- registers - cache - main memory - ssd (solid-state disk) - HDD (hard disk) - optical disk - magnetic tapes (백업!)

Computer-System Architecture

core : 명령어 실행, 데이터 local 저장하는 요소 (register를 가짐)
main CPU with core : 범용 명령어 셋을 실행

Computer System Component

CPU
Processor
Core
MultiCore
MultiProcessor

Single-Processor Systems

하나의 CPU(core 1개)를 갖는 시스템

Multi-Processor Systems (parallel system, tightly-coupled system)

여러 개의 Single-core CPU를 갖는 시스템
processor들은 computer bus, clock, memory, peripheral device 등을 공유한다.
throughput 증가 (processor 수와 성능이 정비례하지는 않음)
Economy of Scale(규모의 경제 - 여러 개의 단일 시스템에 비해 비용 절약)
Increased Reliability(증가된 신뢰성 - 어느 구성 요소의 고장에도 불구하고 동작을 계속할 수 있기에 우아한 퇴보를 넘어 결함 허용이라고 불림)

1) Asymmetric MultiProcessing (AMP) - 각 processor에 특정 작업이 할당

서로 다른 칩에 각각 CPU가 있는 구조
processor가 실행하는 task가 구분됨
core 간 기능 차이가 있음

2) Symmetric multiprocessing (SMP) - 각 processor가 모든 작업 수행

메모리 하나에 각각 연결된 CPU가 각각의 register와 cache 가지고 task 수행
서로 다른 칩에 각각 CPU가 있는 구조
processor가 실행하는 task 구분이 없으며 core 간 기능 차이가 없음

Multi-core systems - 하나의 CPU에 여러 core를 넣음, 진화된 구조

여러 core들이 한 chip에 있는 구조
한 칩에서 CPU core끼리 통신하기에 칩 사이 통신보다 훨씬 빠름
power를 적게 쓰며 각 core는 자신의 register set과 local cache를 가짐

이러한 multi-processor system에서 CPU를 추가한다면 분명 성능이 향상될 수 있지만 확장성은 떨어지게 된다.

또한 너무 많은 CPU를 추가하는 경우 system bus에 대한 경쟁을 초래하여 성능 저하로 이어진다.

Clustered Systems

multiple-processor와 비슷하나 아래와 같은 차이점이 있다.

node(individual systems)들로 구성된다.
각 node들은 multicore system으로, 느슨하게 연결된다.
storage를 공유하고 LAN이나 faster interconnect를 통해 연결된다.

즉, 멀티프로세서 시스템은 여러 CPU가 하나의 시스템을 이루는 것이지만, 클러스터 시스템은 여러 독립적인 시스템(node)들이 모여 하나의 시스템을 이루는 것이다.

asymmetric clustering : node들의 기능이 비대칭, 한 machine은 hot-standby mode (모니터링만 하고 대기중). 나머지가 사용됨
sysmmetric clustering : node들의 기능이 대칭, 서로 모니터링하고 노는 node없이 모두 사용됨

다음과 같은 특징이 있다.

high-availabilty service : 한 node가 고장나도 나머지가 정상 작동
high-performance computing environments : 한 어플리케이션이 클러스터 내 모든 컴퓨터에서 병렬 실행, 작업 분배 → 컴퓨팅 파워가 훨씬 좋다.
reliability : 안정성이 높다. graceful degradation(연속적인 서비스 제공), fault tilerant(failure에도 불구하고 계속 동작 가능)

Operating-System Operations

Initial program (Bootstrap program)

컴퓨터 전원 키면서 실행되는 첫 프로그램
OS를 메모리에 로딩하는 프로그램

컴퓨터를 실행하기 위해 초기 프로그램인 bootstrap program 실행해야 한다.

비휘발성인 firmware로 HW에 저장되어 부팅 시 실행된다.

시스템을 초기화시킨다 (CPU register, device controller, memory contents)
OS 커널을 찾아 메모리에 로드한다.
커널이 로드되어 실행되면 시스템과 사용자에게 서비스를 제공한다. "systemd"라는 프로그램은 리눅스에서 가장 먼저 실행되며, 다른 daemon을 시작한다.

이벤트의 처리 Events

이벤트는 interrupt를 발생시켜 신호를 보낸다.

Hardware interrupt : device에서 발생
Trap or Exception : software error, system call (CPU의 도움이 필요한 경우 OS 필요)

Multiprogramming and Multitasking

프로그램은 단순히 저장 장치에 저장된 파일에 불과하며 이러한 프로그램이 메모리에 올라와 실행되면 그것을 프로세스라 부른다.

Multiprogramming

여러 프로그램을 메모리에 로드해두고 한 프로세스가 대기 상태가 되면 다른 프로세스의 작업을 수행하는 시스템
한 개 이상 프로그램이 실행
여러 메모리가 동시에 올라가 있음 → CPU 활용 증가

Multitasking (=multiprocessing)

multiprogramming의 논리적 확장
하나의 CPU를 가지고 여러 프로세스 돌리기
CPU scheduling
- CPU 효율 제일 좋게 만들도록 고려
- 어떤 CPU를 다음으로 돌릴까 switch하며 작업
다음과 같은 기능 필요
- memory management : 여러 process들이 동시에 memory에 접근해서는 안됨
- CPU scheduling : 어떤 작업을 먼저 처리할 지 결정해야 함
- process scheduling, disk storage and memory management : 여러 process들을 동시에 실행시키기 위해 서로 영향을 미치는 기능을 제한해야 함

Dual-mode and Multimode Operation

악의적으로 사용자가 OS 코드를 멋대로 수정하는 경우 문제를 방지하기 위해 다른 프로그램이 잘못 실행되지 않도록 해야한다.

그래서 나온 것이 Dual mode로, 실행 모드를 구별하여 권한을 달리 하는 것이다.

user mode (1)
kernel mode (0) (= supervisor mode, system mode, privileged mode)

node의 전환은 system call에 의해 이뤄진다.

user application이 OS에 service 요청
system은 반드시 user mode에서 kernel mode로 전환해야 함

Timer

특정 시간이 지난 후 interrupt가 발생하도록 설정
사용자 프로그램이 무한 루프나 system service 호출에 실패하여 제어가 OS로 넘어가지 않는 경우 방지

Process Management

program은 하나지만 procss는 여러 개일 수 있음
process는 순차적으로 수행
한 번에 하나의 명령만 수행
process가 병행 실행되도록 서브 process들을 생성하는 system call 제공

Program counter

process는 program이 어디까지 실행되었는지 북마크하는 program counter를 가지고 있다.

Single-thread process : 하나의 program counter 가짐
Multi-thread process : 여러 개의 program counter 가짐

Memory Management

Main memory는 매우 커다란 byte의 배열이며, 각 byte에는 주소가 있다.

CPU는 instruction-fetch cycle 동안 main memory에 올라온 명령어들을 읽는다.

그리고 data-fetch cycle 동안 main memory에 데이터를 읽거나 쓴다.

→ 명령어(Instruction)들은 반드시 CPU에 의해 실행되기 전 memory에 load되어야 한다.

Program 실행 과정

program이 실행될 때 절대 주소로 mapping되고 memory로 load되어야 한다.
program이 실행되면서 memory의 명령어와 데이터에 접근한다.
program이 끝나면 memory 공간이 사용 가능함을 공표하고 다음 program이 load되고 실행된다.

Cache Management

Cache는 매우 빠르고 작은 저장 장치이며, Caching은 cachce memory를 이용해 컴퓨터 속도를 높이는 기술이다.

cache에 자주 사용되는 data를 미리 담아두고 CPU나 disk가 cache의 data를 참조할 수 있도록 한다.

데이터는 사용되면서 cache에 일시적으로 저장됨

특정 데이터 필요 시 cache를 먼저 확인
size에 제약이 있어 관리가 필요
파일의 중복성이 증가하지만 속도 역시 증가함
지역성(Locality) 원리를 사용 → 시간지역성은 한 번 접근한 데이터에 다시 접근할 확률이 높다는 것이고, 공간지역성은 특정 데이터와 가까운 메모리 주소에 있는 다른 데이터에도 접근할 가능성이 높다는 것이다.

'CS > 운영체제' 카테고리의 다른 글

[공룡책🦖] ch6 Synchronization Tools (0)	2023.07.20
[공룡책🦖] CPU Scheduling (1)	2023.07.19
[공룡책🦖] 쓰레드 & 동시성 Threads & Concurrency (0)	2023.07.14
[공룡책🦖] 프로세스 (0)	2023.07.11
[공룡책🦖] 운영체제 구조 (0)	2023.07.02

백짱미 개발log