Concurrency Runtime 에서는 기존의 멀티스레드 프로그래밍할 때, 필수적인 스레드를 생성하는 함수( CreateThread(), _beginthread() 등 )와 같은 기능을 제공합니다.
이 글에서는 어떻게 위와 같은 기능을 제공하고, 어떻게 사용하면 되는지 알아보도록 하겠습니다.
ScheduleTask
이 전에 설명했던 Parallel Patterns Library( 이하, PPL ) 이나 Asynchronous Agents Library( 이하, AAL ) 을 사용하게 되면 암묵적으로 스레드가 생성되고, 관리되기 때문에, 아주 간단한 작업을 처리할 때에는 비교적 높은 오버헤드( overhead )를 갖게 됩니다.
그래서 Concurrency Runtime 에서는 간단한 작업들을 처리하기에 비교적 적은 오버헤드를 갖는 기능을 제공합니다.
이 간단한 작업을 처리하는 방법은 기존의 스레드를 생성하는 방법과 유사합니다. 즉, 직접 스레드 코드를 제어하고 싶을 때, 사용할 수 있습니다.
아쉬운 점은 간단한 작업의 처리를 완료했을 때, 알려주지 않습니다. 스레드 핸들을 사용하지 않기 때문에 WaitForSingleObject() 와 같은 함수도 사용할 수 없습니다.
그렇기 때문에 스레드로 수행될 함수의 인자를 넘길 때, 스레드 종료를 알리는 메커니즘에 필요한 데이터를 포함해주어야 합니다.( 또는 전역적으로.. )
Concurrency Runtime 에서는 위와 같이 스레드를 생성하는 기능을 제공하지만, 간단한 작업이 아니라면 PPL 또는 AAL 을 사용하는 것을 권하고 있습니다.
이러한 기능은 ScheduleGroup::ScheduleTask(), CurrentScheduler::ScheduleTask(), Scheduler::ScheduleTask() 를 호출하여 사용합니다.
매개변수의 내용은 위의 ScheduleGroup::ScheduleTask() 와 같습니다.
예제
위에 언급된 내용과 함수들을 어떻게 사용하는 알아보도록 하겠습니다.
시나리오
새로운 스레드를 생성하고, 그 스레드에서 인자로 전달 받은 구조체의 내용을 출력하는 내용입니다.
코드
#include <iostream>
#include <concrt.h>
using namespace std;
using namespace Concurrency;
void __cdecl MyThreadFunction( void* pParam );
// 스레드에서 사용할 데이터
struct MyData
{
int val1;
int val2;
event signal;
};
int main()
{
MyData* pData = new MyData;
if( nullptr == pData )
return 1;
pData->val1 = 50;
pData->val2 = 100;
// _beginthreadex() 처럼 스레드를 생성하고 인자로 넘어간 함수를 생성된 스레드에서 수행한다.
CurrentScheduler::ScheduleTask( MyThreadFunction, pData );
// 수행 중인 작업이 끝날 때까지 대기.
pData->signal.wait();
// 작업이 끝난 후, 자원 해제.
delete pData;
return 0;
}
[ 코드2. CurrentScheduler::ScheduleTask() 를 사용하여 스레드를 생성하는 예제 ]
간단한 구조체를 생성하고, 스레드에서 수행될 함수에 전달합니다.
스레드에서는 구조체의 정보를 출력합니다.
스레드의 수행이 종료되기 전에 구조체를 제거하면 안되므로, event 객체를 이용해 스레드가 종료될 때까지 기다린 후, 제거합니다.
마치는 글
Concurrency Runtime 을 사용 중에 간단하게 스레드를 생성해야 한다면, 기존의 스레드 생성 함수를 사용하는 것보다 일관성 있게 ScheduleTask 를 사용하는 것이 좋습니다.
하지만 이 글에서 언급했듯이 간단하지 않은 작업이라면 PPL 이나 AAL 을 사용하는 것이 좋습니다.
다음 글에서는 Scheduler 에서 제공하는 Context 에 대해서 알아보도록 하겠습니다.
Scheduler 는 항상 하나 이상의 스케줄 그룹을 가지고 있습니다. 스케줄 그룹이 무엇인지 알아보고 동시성 프로그래밍에 어떤 영향을 주는지 알아보도록 하겠습니다.
SchedulerGroup
SchedulerGroup 이란 Scheduler 가 스케줄링 해야 할 작업들을 모아 놓은 스케줄 그룹을 대표하는 클래스입니다.
정책
이전 글에서 본 스케줄러 정책들 중 SchedulingProtocol 정책은 스케줄링 순서를 변경하여 작업들의 처리 순서를 변경할 수 있습니다. ScheduleringProtocol 정책이 EnhanseScheduleGroupLocality 로 설정된 경우에는 스케줄링 중인 스케줄 그룹을 변경하지 않고, 현재 스케줄링 중인 스케줄 그룹을 다른 스케줄 그룹보다 먼저 처리합니다. 반면에 SchedulingProtocol 정책이 EnhanseForwardProgress 로 설정된 경우에는 다른 스케줄링 그룹의 작업을 처리합니다. 스케줄 그룹 간에 작업을 공평하게 처리하게 됩니다.
생성
CurrentScheduler::CreateScheduleGroup() 또는 Scheduler::CreateScheduleGroup() 을 통해 ScheduleGroup 객체를 생성할 수 있습니다.
Scheduler 가 참조 개수를 사용하여 수명을 관리하는 것처럼 ScheduleGroup 객체 또한 참조 개수를 사용합니다. 생성되는 순간 참조 개수는 1이 됩니다. SchedulerGroup::Reference() 는 참조 개수는 1이 증가하고, SchedulerGroup::Release() 는 참조 개수가 1이 감소하게 됩니다.
동작 및 사용
Scheduler 객체에는 기본적으로 기본 ScheduleGroup 을 가지고 있습니다. 명시적으로 ScheduleGroup 을 생성하지 않는다면 스케줄링 해야 할 작업들은 기본 ScheduleGroup 에 추가됩니다.
ScheduleGroup 은 Concurrency Runtime 중 Asynchronous Agents Library( 이하, AAL ) 에서 사용할 수 있습니다. agent 클래스나 message block 들의 생성자로 ScheduleGroup 을 전달하여 사용할 수 있습니다.
최대 동시성 리소스( computing core ) 의 개수를 2개로 하고, 한 번은 SchedulingProtocol 정책을 EnhanceScheduleGroupLocality 로 하고, 한 번은 EnhanceForwardProgress 으로 하여 작업의 순서를 알아보았습니다.
2개의 스케줄 그룹을 생성하고, 하나의 그룹에 2개의 작업을 추가하여, 총 4개의 작업이 수행됩니다.
예제의 spin_loop() 는 어떤 작업을 처리하는 것을 의미하고 wait() 는 양보를 뜻합니다. wait() 가 호출되면 다른 작업이 스케줄링 되는데 이 때 결정되는 작업이 어떤 작업인지는 앞서 설정한 SchedulingProtocol 정책에 따릅니다.
EnhanceScheduleGroupLocality 로 설정된 경우에는 같은 스케줄 그룹 내의 작업이 처리되는 반면에, EnhanceForwardProgress 로 설정된 경우에는 다른 스케줄 그룹의 작업이 처리되게 됩니다.
[ 그림1. 처리되는 스케줄 그룹의 순서를 확인하는 예제 실행 결과 ]
마치는 글
이렇게 스케줄링 정책과 스케줄 그룹을 통해서 스케줄링 순서를 결정하는데 관여할 수 있다는 것을 알아보았습니다.
다음 글에서는 스레드를 직접 생성하여 사용할 수 있는 ScheduleTask 라는 것에 대해서 알아보도록 하겠습니다.
static 생성자는 클래스의 생성자에서 static 멤버를
초기화 하고 싶을 때 사용합니다.
ref
class, value class, interface에서 사용할
수 있습니다.
#include
"stdafx.h"
#include
<iostream>
using
namespace System;
ref class
A {
public:
static int a_;
static A()
{
a_ += 10;
}
};
ref class
B {
public:
static int b_;
static B()
{
//a_ += 10; // error
b_ += 10;
}
};
ref class
C {
public:
static int c_ = 100;
static C()
{
c_ = 10;
}
};
int
main()
{
Console::WriteLine(A::a_);
A::A();
Console::WriteLine(A::a_);
Console::WriteLine(B::b_);
Console::WriteLine(C::c_);
getchar();
return 0;
}
< 결과 >
static 생성자는 런타임에서 호출하기 때문에 클래스 A의
멤버 a_는 이미 10으로 설정되어 있습니다. 그리고 이미 런타임에서 호출하였기 때문에 명시적으로 A::A()를
호출해도 실제로는 호출되지 않습니다.
클래스
B의 경우 static 생성자에서 비 static 멤버를
호출하면 에러가 발생합니다.
클래스
C의 경우 static 멤버 c_를 선언과 동시에
초기화 했지만 런타임에서 static 생성자를 호출하여 값이 10으로
설정되었습니다.
initonly
initonly로 선언된 멤버는 생성자에서만 값을 설정할 수 있습니다. 그리고 initonly static로 선언된 멤버는 static 생성자에서만 값을 설정할 수 있습니다.
ref class C
{
public:
initonly staticint x;
initonly staticint y;
initonly int z;
static C()
{
x =1;
y =2;
// z = 3; // Error
}
C()
{
// A = 2; // Error
z =3;
}
void sfunc()
{
// x = 5; // Error
// z = 5; // Error
}
};
int main()
{
System::Console::WriteLine(C::x);
System::Console::WriteLine(C::y);
C c;
System::Console::WriteLine(c.z);
return0;
}
literal
literal로 선언된 멤버는 선언과 동시에 값을 설정하고 이후 쓰기는 불가능합니다. 오직 읽기만 가능합니다.
usingnamespaceSystem;
ref class C
{
public:
literal String^ S ="Hello";
literal int I =100;
};
int main()
{
Console::WriteLine(C::S);
Console::WriteLine(C::I);
return0;
}
참고 http://cppcli.shacknet.nu/cli:static%E3%82%B3%E3%83%B3%E3%82%B9%E3%83%88%E3%83%A9%E3%82%AF%E3%82%BF http://cppcli.shacknet.nu/cli:initonly http://cppcli.shacknet.nu/cli:literal
위와 같이 생성한 SchedulerPolicy 객체는 3개의 정책을 설정하는데, 사용할 최소 동시성 자원( computing core ) 의 개수는 2개, 사용할 최대 동시성 자원의 개수는 4개, 현재 컨텍스트의 스레드 우선순위를 최고 순위로 설정하게 됩니다.
위 코드에서 보여드린 정책들 뿐만 아니라 여러 가지 정책들을 설정할 수 있습니다.
설정할 수 있는 정책들
PolicyElementKey 열거형으로 설정할 수 있는 정책들을 정의하고 있습니다. 그 내용은 다음과 같습니다.
정책 키
설명
기본 값
SchedulerKind
작업들을 수행할 때, 일반 스레드를 사용할지, UMS 스레드를 사용할지 설정
ThreadScheduler
MaxConcurrency
스케줄러에서 사용할 최대 동시성 자원 수
MaxExecutionResources
MinConcurrency
스케줄러에서 사용할 최소 동시성 자원 수
1
TargetOversubscriptionFactor
작업을 수행 시, 자원에 할당할 스레드의 수
1
LocalContextCacheSize
캐시할 수 있는 컨텍스트 수
8
ContextStackSize
각 컨텍스트에서 사용할 스택 크기( KB )
0( 기본 스택 크기 사용 )
ContextPriority
각 컨텍스트의 스레드 우선 순위
THREAD_PRIORITY_NORMAL
SchedulingProtocal
스케줄 그룹의 작업 예약 알고리즘
EnhanceScheduleGroupLocality
DynamicProgressFeedback
자원 통계 정책, 사용 금지.
ProgressFeedbackEnabled
[ 표1. PolicyElementKey 열거형에 정의된 설정할 수 있는 정책들 ]
기본 정책 설정
Asynchronous Agents Library( 이하, AAL ) 에는 우리가 생성한 정책을 지정한 Scheduler 객체를 사용할 수 있지만, Parallel Patterns Library ( 이하, PPL ) 에는 우리가 생성한 Scheduler 객체를 사용할 수 없고, 내부적으로 생성되는 기본 스케줄러를 사용하게 됩니다. 기본 스케줄러는 기본 정책을 사용하게 되는데, 이 기본 정책을 미리 설정해 둘 수 있습니다.
SetDefaultSchedulerPolicy() 의 인자로 SchedulerPolicy 를 생성하여 설정하면, 직접 Scheduler 를 생성하여 사용하지 않더라도, 내부에서 생성되는 기본 스케줄러에도 정책을 설정할 수 있습니다.
스케줄러 정책 획득
이미 생성된 Scheduler 객체로부터 설정된 정책을 가져올 수 있습니다.
_CRTIMP static SchedulerPolicy __cdecl GetPolicy(); // CurrentScheduler::GetPolicy() static function
virtual SchedulerPolicy GetPolicy(); // Scheduler::GetPolicy() member function
[ 코드4. GetPolicy() 들의 선언 ]
Scheduler 객체로부터 얻어온 정책은 설정할 때의 정책과 다를 수 있습니다. 정책을 설정하더라도, 해당 시스템에서 설정 가능한 정책만 적용되고, 그렇지 않은 경우에는 기본 정책 값이나 Resource Manager 에 의해 적당한 값으로 적용됩니다.
예를 들어 UMS 를 사용할 수 없는 시스템에서 UMS 를 사용하라고 설정하더라도, ThreadScheduler로 설정됩니다.
예제
Scheduler 를 사용하는 방법과 SchedulerPolicy 인해 어떤 영향을 받는지 알아보는 예제를 보도록 하겠습니다.
시나리오
문자열 순열을 구하는 프로그램입니다. 문자열 순열이란 문자열을 이루는 알파벳들로 만들 수 있는 모든 경우의 수를 말합니다.
문자열 순열을 구하는 작업은 오랜 시간이 걸리므로 agent 를 이용해 비 동기 처리를 합니다. 그리고 문자열 순열을 구하는 작업을 하는 agent 와 통신을 하며 진행 상황을 출력해주는 agent 가 비 동기로 처리됩니다.
이 때, Concurrency Runtime 은 협조적 스케줄링을 하기 때문에 바쁜 스케줄러에 더 많은 자원을 할당합니다. 반대로 바쁘지 않은 스케줄러에는 적은 자원이 할당됩니다. 이로 인해 진행 상황을 출력하는 agent 가 제대로 스케줄링되지 않는 현상이 발생하게 됩니다.
이의 해결책으로 진행 상황을 출력하는 agent 의 스레드 우선 순위를 높게 설정합니다.
코드
#include <Windows.h>
#include <ppl.h>
#include <agents.h>
#include <iostream>
#include <sstream>
using namespace std;
using namespace Concurrency;
// 문자열 순열을 구하는 agent
class permutor
: public agent
{
public:
explicit permutor( ISource< wstring >& source, ITarget< unsigned int >& progress )
: source( source )
, progress( progress ) { }
explicit permutor( ISource< wstring >& source, ITarget< unsigned int >& progress, Scheduler& scheduler )
: agent( scheduler )
, source( source )
, progress( progress ) { }
protected:
void run()
{
wstring s = receive( this->source );
this->permute( s );
this->done();
}
unsigned int factorial( unsigned int n )
{
if( 0 == n )
return 0;
if( 1 == n )
return 1;
return n * this->factorial( n - 1 );
}
wstring permutation( int n, const wstring& s )
{
wstring t( s );
size_t len = t.length();
for( unsigned int i = 2; i < len; ++i )
{
swap( t[ n % i ], t[i] );
n = n / i;
}
return t;
}
void permute( const wstring& s )
{
unsigned int permutation_count = this->factorial( s.length() );
long count = 0;
unsigned int previous_percent = 0u;
send( this->progress, previous_percent );
parallel_for( 0u, permutation_count, [&]( unsigned int i )
{
this->permutation( i, s );
unsigned int percent = 100 * InterlockedIncrement( &count ) / permutation_count;
if( percent > previous_percent )
{
send( this->progress, percent );
previous_percent = percent;
}
} );
send( this->progress, 100u );
}
private:
ISource< wstring >& source;
ITarget< unsigned int >& progress;
};
// 진행 상황을 출력하는 agent
class printer
: public agent
{
public:
explicit printer( ISource< wstring >& source, ISource< unsigned int >& progress )
: source( source )
, progress( progress ) { }
explicit printer( ISource< wstring >& source, ISource< unsigned int >& progress, Scheduler& scheduler )
: agent( scheduler )
, source( source )
, progress( progress ) { }
protected:
void run()
{
wstringstream ss;
ss << L"Computing all permutations of '" << receive( this->source ) << L"'..." << endl;
wcout << ss.str();
unsigned int previous_percent = 0u;
while( true )
{
unsigned int percent = receive( this->progress );
if( percent > previous_percent || percent == 0u )
{
wstringstream ss;
ss << L'\r' << percent << L"% complete...";
wcout << ss.str();
previous_percent = percent;
}
if( 100 == percent )
break;
}
wcout << endl;
this->done();
}
private:
ISource< wstring >& source;
ISource< unsigned int >& progress;
};
// agent 의 작업을 관리하는 함수
void permute_string( const wstring& source, Scheduler& permutor_scheduler, Scheduler& printer_scheduler )
{
single_assignment< wstring > source_string;
unbounded_buffer< unsigned int > progress;
permutor agent1( source_string, progress, permutor_scheduler );
printer agent2( source_string, progress, printer_scheduler );
agent1.start();
agent2.start();
send( source_string, source );
agent::wait( &agent1 );
agent::wait( &agent2 );
}
int main()
{
const wstring source( L"Grapefruit" );
// 기본 정책으로 작업을 수행
Scheduler* pDefault_scheduler = CurrentScheduler::Get();
wcout << L"With default scheduler: " << endl;
permute_string( source, *pDefault_scheduler, *pDefault_scheduler );
wcout << endl;
// 진행 상황을 출력하는 agent 에 필요한 스레드 우선 순위를 높게 하는 정책을 설정하여 적용
SchedulerPolicy printer_policy( 1, ContextPriority, THREAD_PRIORITY_HIGHEST );
Scheduler* pPrinter_scheduler = Scheduler::Create( printer_policy );
HANDLE hShutdownEvent = CreateEvent( NULL, FALSE, FALSE, NULL );
pPrinter_scheduler->RegisterShutdownEvent( hShutdownEvent );
wcout << L"With higher context priority: " << endl;
permute_string( source, *pDefault_scheduler, *pPrinter_scheduler );
wcout << endl;
pPrinter_scheduler->Release();
WaitForSingleObject( hShutdownEvent, INFINITE );
CloseHandle( hShutdownEvent );
}
[ 코드5. Scheduler 객체에 스레드 우선 순위를 높인 SchedulerPolicy 객체를 적용한 예제 ]
기본 정책으로 수행했을 때에는 작업 진행 상황이 제대로 출력되지 않는 반면에, 스레드 우선 순위를 높게 설정한 경우에는 제대로 출력되는 것을 보실 수 있습니다.
[ 그림1. SchedulerPolicy 로 스레드 우선 순위를 변경한 예제 실행 결과 ]
마치는 글
이번 글에서는 Scheduler 의 기본적인 기능 중 하나인 SchedulerPolicy 를 설정하는 방법을 알아보았습니다. SchedulerPolicy 를 이용하여 기본 정책으로 해결되지 않는 다양한 문제점들을 해결 하실 수 있을 것입니다.
이번 글은 Parallel Patterns Library( 이하 PPL ) 과 Asynchronous Agents Library( 이하 AAL ) 내부에서 스케줄링을 하는 Scheduler 에 대해서 알아보도록 하겠습니다.
Scheduler class
Scheduler 클래스는 Concurrency Runtime 에서 실제로 스케줄링을 하는 객체입니다. 우리는 Scheduler 객체를 사용해서 스케줄링의 방법을 설정할 수 있습니다.
Scheduler 는 내부적으로 작업들을 그룹화한 ScheduleGroup 을 관리합니다. 또한 요청된 작업을 수행하는 Context 객체에 접근할 수 있도록 하여, 좀 더 구체적인 스케줄링을 할 수 있도록 도와줍니다.
Scheduler 생성
우리가 직접 Scheduler 를 생성하지 않아도, Concurrency Runtime 내부에서 기본 Scheduler 가 생성되어 스케줄링을 하게 됩니다. 이 경우에는 스케줄링 정책을 바꿀 수는 있으나, 세밀하게 제어할 수 없습니다.
기본 Scheduler 외에 직접 우리가 Scheduler 를 생성하는 방법은 2 가지가 있습니다.
CurrentScheduler::Create() 는 현재 컨텍스트와 연결하는 Scheduler 를 만듭니다.
Scheduler::Create() 는 현재 컨텍스트와 연결되지 않는 Scheduler 를 만듭니다.
Scheduler 는 내부적으로 참조 개수( reference counting ) 을 사용하여, 수명을 관리합니다. 그래서 참조 개수가 0이 되면 Scheduler 가 소멸됩니다.
Scheduler::Create()
현재 컨텍스트와 연결되지 않은 Scheduler 를 생성합니다. 참조 개수가 1로 설정됩니다.
Scheduler::Attach()
현재 컨텍스트와 Scheduler 를 연결합니다. 참조 개수가 증가합니다.
Scheduler::Reference()
참조 개수가 증가합니다.
Scheduler::Release()
참조 개수가 감소합니다. 참조 개수가 0이 되면 소멸됩니다.
CurrentScheduler::Create()
현재 컨텍스트와 연결된 Scheduler 를 생성합니다. 참조 개수가 1로 설정됩니다.
CurrentScheduler::Detach()
현재 컨텍스트를 분리합니다. 참조 개수가 감소합니다. 참조 개수가 0이 되면 소멸됩니다.
생성과 소멸, 연결과 분리
위와 같은 함수들을 제공하지만, 생성과 소멸, 연결과 분리가 짝을 이루어야 합니다.
CurrentScheduler::Create() 로 생성하였다면, CurrentScheduler::Detach() 로 소멸시키는 것이 좋습니다.
Scheduler::Create() 로 생성하고, Scheduler::Attach() 로 연결하였다면, Scheduler::Detach() 로 해제하고, Scheduler::Release() 로 소멸해야 합니다.
만약 Scheduler::Reference() 를 통해 참조 개수를 증가시켰다면, Scheduler::Release() 를 사용하여 참조 개수를 감소시켜주어야 합니다.
소멸 시점 알림
모든 작업이 끝나기 전에는 Scheduler 를 소멸시키지 않습니다. 언제 Scheduler 가 소멸되는지 알기 위해서는 RegisterShutdownEvent() 를 사용하여 Windows API 의 EVENT 객체를 지정해 주고, WaitForSingleObject() 를 사용하여 소멸될 때까지 대기할 수 있습니다.
그 외의 멤버 함수
위에서 설명한 멤버 함수 이외에 제공하는 멤버 함수들을 알아보도록 하겠습니다.
CurrentScheduler
Get() – 현재 컨텍스트에 연결된 Scheduler 의 포인터를 반환합니다. 참조 개수가 증가하지 않습니다.
CreateScheduleGroup() - ScheduleGroup 을 생성합니다.
ScheduleTask() – Scheduler 의 일정 큐에 간단한 작업을 추가합니다.
GetPolicy() – 연결된 정책의 복사본을 반환합니다.
Scheduler
CreateScheduleGroup() – ScheduleGroup 을 생성합니다.
ScheduleTask() – Scheduler 의 일정 큐에 간단한 작업을 추가합니다.
GetPolicy() – 연결된 정책의 복사본을 반환합니다.
SetDefaultSchedulePolicy() – 기본 Scheduler 에 적용될 정책을 설정합니다.
ResetDefaultSchedulePolicy() – 기본 Scheduler 의 정책을 SetDefaultSchedulerPolicy() 를 사용하기 전의 정책으로 설정합니다.
마치는 글
이번 글에서는 Concurrency Runtime 의 Scheduler 에 대해서 알아보았습니다. 위의 설명만으로는 어떻게 사용해야 하는지, 어떤 기능을 하는지 알기 어렵습니다.
다음 글에서 위에서 소개해드린 멤버 함수들의 사용 방법과 활용 예제들에 대해서 알아보도록 하겠습니다.
아마도 이 글이 Asynchronous Agents Library( 이하 AAL ) 에 관련된 마지막 글이라고 생각이 됩니다. 더 추가적으로 적을 내용이 생기면 더 적어 보도록 하겠습니다.
이전 글까지 AAL 에서 제공하는 message block 들을 알아보았지만, 제공되는 것들이 마음에 들지 않는 분들은 직접 message block 을 만들어 사용할 수 있습니다.
직접 message block 을 만들어 사용하는 것이 그리 간단하지만은 않기 때문에 이번 글이 좀 길어질 것 같습니다. 천천히 읽어주시기 바랍니다.
Message block 의 종류와 인터페이스
우선 message block 정의에 앞서 message block 의 종류에 대해서 알아보는 것이 좋겠습니다. 이미 이전 글들에서 본 제공되는 message block 들을 보시면서 아셨겠지만, 한 번 더 짚고 넘어가도록 하겠습니다.
Message 를 보내는 역할을 하는 message block 을 source block 이라 하고, message 를 받는 역할을 하는 역할을 하는 message block 을 target block 이라고 합니다.
이 두 가지 종류의 block 들의 기본적인 행동들을 알리기 위해서 source block 들은 ISource 인터페이스를, target block 들은 ITarget 인터페이스를 상속받아 인터페이스 메소드들을 정의해야 합니다.
Message block 의 기본 클래스들
위에서 언급한 ISource 인터페이스나 ITarget 인터페이스를 직접 상속받아 정의해도 되지만, AAL 에서는 그 인터페이스를 상속받아 정의하기 쉽도록 해주는 기본 클래스 3 가지를 제공합니다.
source_block – ISource 인터페이스를 상속받고, 다른 block 에 message 를 보냅니다.
target_block – ITarget 인터페이스를 상속받고, 다른 block 으로부터 message 를 받습니다.
propagator_block – ISource 인터페이스와 ITarget 인터페이스를 상속받고, 다른 block 들과 message 를 보내고 받습니다.
AAL 에서는 사용자 정의 message block 을 정의할 때, 인터페이스를 직접 상속받기 보다는 위의 기본 클래스들을 상속받아 정의하는 것을 권고하고 있습니다.
연결 관리 및 message 관리를 위한 템플릿 매개변수에 사용할 수 있는 클래스 템플릿
위의 3가지 기본 클래스들은 클래스 템플릿으로, message block 들간의 연결을 어떻게 관리할 것인지, message 들을 어떻게 관리할 것인지에 대한 정보를 템플릿 매개변수를 통해 지정할 수 있습니다.
AAL 은 연결 관리를 위한 2가지의 클래스 템플릿을 제공하고 있습니다.
single_link_registry – source 나 target 의 하나의 연결만 허용.
multi_link_registry – source 나 target 의 여럿의 연결을 허용.
예를 들면, AAL 에서 제공하는 transformer 는 출력을 하나의 연결만 허용하는 single_link_registry 를 사용하고, 입력은 여럿의 연결을 허용하는 multi_link_registry 를 사용하고 있습니다.
template<class _Input, class _Output>
class transformer : public propagator_block<single_link_registry<ITarget<_Output>>, multi_link_registry<ISource<_Input>>>
[ 코드1. transformer 에서 사용되는 single_link_registry 와 multi_link_registry ]
또한 message 관리를 위한 하나의 클래스 템플릿을 제공합니다.
ordered_mesage_processor – message 를 받는 순서대로 처리하도록 허용.
재정의해야 할 멤버 함수들
위에 말한 기본 클래스들을 상속한 클래스는 다음과 같은 멤버 함수를 재정의해야 합니다.
source_block 을 상속한 클래스가 재정의해야 할 멤버 함수들
propagate_to_any_targets()
accept_message()
reserve_message()
consume_message()
release_message()
resume_propagation()
propagate_to_any_targets()
입력 message 나 출력 message 를 비 동기 또는 동기적으로 처리하기 위해 런타임으로부터 호출됩니다.
target block 은 message 를 제공받을 때와 message 를 나중에 사용하기 위해 예약해야 할 때 reserve_message() 를 호출합니다.
target block 은 하나의 message 를 예약한 후에, message 를 사용하기 위해 consume_message() 를 호출하거나 예약을 취소하기 위해 release_message() 를 호출할 수 있습니다.
consume_message() 는 accept_message() 와 함께 사용되어 message 의 소유권을 보내거나 message 의 복사본을 보내도록 할 수 있습니다.
예를 들어, unbounded_buffer 와 같은 message block 은 오직 하나의 target 에만 message 를 보냅니다. 즉, message 의 소유권을 target 에 보냅니다. 그렇기 때문에 보낸 후, message block 내에는 보낸 message 가 남아있지 않습니다.
반면에 overwrite_buffer 와 같은 message block 은 각 연결된 target 에 각각 message 를 제공합니다. 즉, message 의 복사본을 보냅니다, 그래서 보낸 후, message block 내에 보낸 message 가 여전히 존재하게 됩니다.
target block 이 예약된 message 를 사용하거나 취소한 후에, 런타임은 resume_propagation() 을 호출합니다. resume_propagation() 은 큐( queue )의 다음 message 를 시작으로 message 의 전달을 계속해서 진행시킵니다.
target_block 을 상속한 클래스가 재정의해야 할 멤버 함수들
propagate_message()
send_message() ( option )
propagate_message(), send_message()
런타임은 다른 block 으로부터 현재의 block 으로 message 를 비 동기적으로 받기 위해 propagate_message() 를 호출합니다.
send_message() 는 비 동기적이 아니라 동기적으로 message 를 보내는 것을 제외하면 propagate_message() 와 비슷합니다.
기본적으로 send_message() 의 정의는 모든 입력 message 를 거부하도록 구현되어 있습니다.
만약 message 가 target block 에 설정된 필터 함수를 통과하지 못하면 send_message() 나 propagate_message() 를 호출하지 않습니다.
propagator_block 을 상속한 클래스가 재정의해야 할 멤버 함수들
propagator_block 은 source_block 과 target_block 의 특징을 모두 상속하므로 두 클래스에 대해 재정의해야 할 멤버 함수들을 모두 재정의해야 합니다.
예제: priority_buffer
priority_buffer 는 우선 순위를 기준으로 순서를 정하는 사용자 정의 message block 입니다. 여럿의 message 들을 받을 때 우선 순위대로 처리할 때 사용하기 유용합니다.
Message 큐를 가지고 있고, source 와 target 의 역할을 하며, 여럿의 source 와 여럿의 target 을 연결할 수 있기 때문에 unbounded_buffer 와 비슷합니다.
그러나 unbounded_buffer 는 message 를 받는 순서를 기반으로 message 를 전달한다는 것이 다릅니다.
priority_buffer 는 우선 순위와 데이터를 같이 전달해야 하므로 우선 순위 타입과 데이터의 타입을 포함하는 tuple 타입의 message 를 전달합니다.
priority_buffer 는 2개의 message 큐를 관리합니다. 입력 message 를 위한 std::priority_queue 와 출력 message 를 위한 std::queue 입니다.
priority_buffer 의 정의를 위해 propagator_block 을 상속하고 7개의 멤버 함수들을 정의해야하고, link_target_notification() 과 send_message() 를 재정의해야 합니다.
또한 2개의 public 멤버 함수인 enqueue() 와 dequeue() 를 정의합니다. private 멤버 함수로 propagate_priority_order() 를 정의합니다.
코드
#include <agents.h>
#include <queue>
// 우선 순위를 비교할 비교 함수 객체.
namespace std
{
template< class Type, class PriorityType >
struct less< Concurrency::message< tuple< PriorityType, Type > >* >
{
typedef Concurrency::message< tuple< PriorityType, Type > > MessageType;
bool operator()( const MessageType* left, const MessageType* right ) const
{
// message 가 tuple 이므로 get() 을 사용.
return ( get< 0 >( left->payload ) < get< 0 >( right->payload ) );
}
};
template< class Type, class PriorityType >
struct greater< Concurrency::message< tuple< PriorityType, Type > >* >
{
typedef Concurrency::message< tuple< PriorityType, Type > > MessageType;
bool operator()( const MessageType* left, const MessageType* right ) const
{
return ( get< 0 >( left->payload ) > get< 0 >( right->payload ) );
}
};
}
namespace Concurrency
{
// Type - 데이터 타입, PriorityType - 우선 순위 타입, PredicatorType - 비교 함수 객체
// source 와 target 역할을 하므로 propagator_block 을 상속받고, 다중 입력 연결과 다중 출력 연결을 허용하므로 모두 multi_link_registry 를 사용.
template< class Type, typename PriorityType = int, typename PredicatorType = std::less< message< std::tuple< PriorityType, Type > >* > >
class priority_buffer
: public propagator_block< multi_link_registry< ITarget< Type > >, multi_link_registry< ISource< std::tuple< PriorityType, Type > > > >
{
public:
~priority_buffer()
{
// 연결을 모두 해제하기 위해 propagator_block 의 remove_network_links() 를 사용.
this->remove_network_links();
}
priority_buffer()
{
// source 와 target 을 초기화 하기 위해 propagator_block 의 initialize_source_and_target() 을 사용.
this->initialize_source_and_target();
}
priority_buffer( filter_method const& filter )
{
this->intialize_source_and_target();
// 필터 함수를 등록하기 위해 target_block 의 register_filter() 를 사용.
this->register_filter( filter );/
}
priority_buffer( Scheduler& scheduler )
{
this->initialize_source_and_target( &scheduler );
}
priority_buffer( Scheduler& scheduler, filter_method const& filter )
{
this->initialize_source_and_target( &scheduler );
this->register_filter( filter );
}
priority_buffer( ScheduleGroup& schedule_group )
{
this->initialize_source_and_target( nullptr, &schedule_group );
}
priority_buffer( ScheduleGroup& schedule_group, filter_method const& filter )
{
this->initialize_source_and_target( nullptr, &schedule_group );
this->register_filter( filter );
}
// 공개 멤버 함수들.
bool enqueue( Type const& item )
{
return Concurrency::asend< Type >( this, item );
}
Type dequeue()
{
return Concurrency::receive< Type >( this );
}
protected:
// message 처리하기 위해 런타임으로 부터 호출됨. message 를 입력 큐에서 출력 큐로 이동하고, 전달.
virtual void propagate_to_any_targets( message< _Target_type >* )
{
message< _Source_type >* input_message = nullptr;
{
critical_section::scoped_lock lock( this->input_lock );
// 보낼 message 를 우선 순위 큐에서 꺼냄.
if( this->input_messages.size() > 0 )
{
input_message = this->input_messages.top();
this->input_messages.pop();
}
}
if( nullptr != input_message )
{
// 입력된 message 는 우선 순위와 데이터를 같이 가지고 있으므로 데이터만 가진 message 로 가공하여 출력 큐에 넣음.
message< _Target_type >* output_message = new message< _Target_type >( get< 1 >( input_message->payload ) );
this->output_messages.push( output_message );
delete input_message;
if( this->output_messages.front()->msg_id() != output_message->msg_id() )
{
return;
}
}
// message 보내기.
this->propagate_priority_order();
}
// target block 이 message 를 받기 위해 호출함. 이 코드에서는 출력 큐에서 message 를 제거해서 소유권을 이전.
virtual message< _Target_type >* accept_message( runtime_object_identity msg_id )
{
message< _Target_type >* message = nullptr;
if( !this->output_messages.empty() && this->output_messages.front()->msg_id() == msg_id )
{
message = this->output_messages.front();
this->output_messages.pop();
}
return message;
}
// target block 이 제공된 message 를 예약하기 위해 호출. 이 코드에서는 전달 가능 여부를 확인.
virtual bool reserve_message( runtime_object_identity msg_id )
{
return ( !this->output_messages.empty() && this->output_messages.front()->msg_id() == msg_id );
}
// target block 이 제공된 message 를 사용하기 위해 호출. 이 코드에서는 message 전달.
virtual message< Type >* consume_message( runtime_object_identity msg_id )
{
return this->accept_message( msg_id );
}
// target block 이 예약된 message 를 취소하기 위해 호출. 이 코드에서는 아무 역할을 하지 않음.
virtual void release_message( runtime_object_identity msg_id )
{
if( this->output_messages.empty() || this->output_messages.front()->msg_id() != msg_id )
{
throw message_not_found();
}
}
// 예약된 message 처리 후, 계속해서 진행.
virtual void resume_propagation()
{
if( this->output_messages.size() > 0 )
this->async_send( nullptr );
}
// 새로운 target 이 연결되었음을 알림.
virtual void link_target_notification( ITarget< _Target_type >* )
{
// 이미 예약된 message 가 있으면 전달하지 않음.
if( this->_M_pReservedFor != nullptr )
return;
// message 보내기.
this->propagate_priority_order();
}
// 비 동기적으로 전달. propagator_block 의 propagate() 에 의해 호출됨.
virtual message_status propagate_message( message< _Source_type >* message, ISource< _Source_type >* source )
{
message = source->accept( message->msg_id(), this );
if( nullptr != message )
{
{
critical_section::scoped_lock lock( this->input_lock );
this->input_messages.push( message );
}
this->async_send( nullptr );
return accepted;
}else
return missed;
}
// 동기적으로 전달. propagator_block 의 send() 에 의해 호출됨.
virtual message_status send_message( message< _Source_type >* message, ISource< _Source_type >* source )
{
message = source->accept( message->msg_id(), this );
if( nullptr != message )
{
{
critical_section::scoped_lock lock( this->input_lock );
this->input_messages.push( message );
}
this->sync_send( nullptr );
return accepted;
}else
return missed;
}
private:
// message 를 보내는 함수.
void propagate_priority_order()
{
// 이미 예약된 message 가 있으면 전달하지 않음.
if( nullptr != this->_M_pReservedFor )
return;
// 출력 큐의 모든 message 를 보냄.
while( !this->output_messages.empty() )
{
message< _Target_type >* message = this->output_messages.front();
message_status status = declined;
// 연결된 target 을 순회하면서 message 를 전달.
for( target_iterator iter = this->_M_connectedTargets.begin();
nullptr != *iter;
++iter )
{
ITarget< _Target_type >* target = *iter;
status = target->propagate( message, this );
if( accepted == status )
break;
if( nullptr != this->_M_pReservedFor )
break;
}
if( accepted != status )
break;
}
}
private:
std::priority_queue<
message< _Source_type >*,
std::vector< message< _Source_type >* >,
PredicatorType > input_messages;
std::queue< message< _Target_type >* > output_messages;
critical_section input_lock;
private:
priority_buffer const& operator=( priority_buffer const& );
priority_buffer( priority_buffer const& );
};
}
[ 코드2. priority_buffer 구현 ]
재정의하는 함수들이 많고, 어디서 어떻게 호출되는지 알기 어려울 수 있습니다. 간단하게 설명하자면 외부로부터 보내는 함수, send() 또는 asend() 에 의해서 message 가 전달될 경우, target block 의 역할을 하게 됩니다. 이 때는 propagate_message() 나 send_message() 중 하나가 호출됩니다.
반대로 외부로부터 받는 함수, receive() 또는 try_receive() 에 의해서 message 를 전달해야 하는 경우, source block 의 역할을 하게 되고, 나머지 함수들이 호출되게 됩니다.
이 예제로 완벽하게는 아니더라도 어떻게 사용자 정의 message block 을 구현해야 하는지 아셨을 것이라 생각됩니다.
사용 코드
#include <ppl.h>
#include <iostream>
#include "priority_buffer.h"
using namespace Concurrency;
using namespace std;
int main()
{
priority_buffer< int > buffer;
parallel_invoke(
[ &buffer ] { for( unsigned int i = 0; i < 25; ++i ) asend( buffer, make_tuple( 1, 12 ) ); },
[ &buffer ] { for( unsigned int i = 0; i < 25; ++i ) asend( buffer, make_tuple( 3, 36 ) ); },
[ &buffer ] { for( unsigned int i = 0; i < 25; ++i ) asend( buffer, make_tuple( 2, 24 ) ); } );
for( unsigned int i = 0; i < 75; ++i )
{
wcout << receive( buffer ) << L' ';
if( ( i + 1 ) % 25 == 0 )
wcout << endl;
}
}
[ 코드3. priority_buffer 를 사용하는 예제 ]
parallel_invoke() 를 사용하기 때문에 순서를 입력되는 순서를 보장할 수 없습니다. 하지만 receive() 를 사용하여 message 를 출력해 보면 우선 순위가 큰 순서대로 출력되는 것을 알 수 있습니다.
[ 그림1. priority_buffer 를 사용하는 예제 결과 ]
마치는 글
사용자 정의 message block 을 구현하는 것을 마지막으로 AAL 에 관련된 글을 마무리합니다. AAL 에 관련해 새로운 소식이 있으면 그 때 다시 AAL 에 관련된 글을 작성하도록 하겠습니다.
다음 글은 AAL 을 포함하는 Concurrency Runtime 에서 제공하는 작업 스케줄러에 대해서 작성해 볼 예정입니다. 작업 스케줄러는 AAL 의 message block 과 함께 유용하게 사용할 수 있으므로 AAL 에 관심이 많으신 분들도 기대하셔도 좋을 것 같습니다.
매개 변수인 _FWaitAll 은 지정된 event 들이 모두 설정될 때까지 기다릴 것인지 여부입니다. false 를 지정하면 하나의 event 라도 설정되면 기다리는 것을 멈추고 계속 진행됩니다.
마지막 매개 변수인 _Timeout 은 최대 시간입니다. 기본 매개 변수인 COOPERATIVE_TIMEOUT_INFINITE 는 무한대를 나타냅니다.
매개 변수 중 _FWaitAll 을 false 로 지정하고, 하나의 event 가 설정되었을 때, 설정된 event 의 _PPEvents 로 지정된 배열의 인덱스가 반환됩니다.
_FWaitAll 을 true 로 지정했을 경우에 모든 event 가 설정되었을 때에는 COOPERATIVE_WAIT_TIMEOUT 이 아닌 값이 반환됩니다.
Windows API 의 이벤트 객체를 사용할 때 함께 사용하는 WaitForMultipleObject() 와 유사합니다.
예제
Windows API 의 이벤트 객체와 어떻게 다른지 알아볼 수 있는 예제를 구현해보겠습니다.
시나리오
우선 최대 2개의 작업이 동시에 수행될 수 있도록 설정합니다.
그리고 하나의 event 를 생성한 후, 5개의 작업을 병렬로 처리합니다. 각 작업마다 생성한 event 가 설정될 때까지 기다리도록 합니다.
메인 스레드에서 1 초 후에 그 event 를 설정합니다.
같은 작업을 Windows API 의 이벤트 객체를 사용해서 구현합니다.
코드
// 코드의 출처는 msdn 입니다.
#include <windows.h>
#include <concrtrm.h>
#include <ppl.h>
#include <iostream>
#include <sstream>
using namespace Concurrency;
using namespace std;
// Demonstrates the usage of cooperative events.
void RunCooperativeEvents()
{
// An event object.
event e;
// Create a task group and execute five tasks that wait for
// the event to be set.
task_group tasks;
for (int i = 0; i < 5; ++i)
{
tasks.run([&] {
// Print a message before waiting on the event.
wstringstream ss;
ss << L"\t\tContext " << GetExecutionContextId()
<< L": waiting on an event." << endl;
wcout << ss.str();
// Wait for the event to be set.
e.wait();
// Print a message after the event is set.
ss = wstringstream();
ss << L"\t\tContext " << GetExecutionContextId()
<< L": received the event." << endl;
wcout << ss.str();
});
}
// Wait a sufficient amount of time for all tasks to enter
// the waiting state.
Sleep(1000L);
// Set the event.
wstringstream ss;
ss << L"\tSetting the event." << endl;
wcout << ss.str();
e.set();
// Wait for all tasks to complete.
tasks.wait();
}
// Demonstrates the usage of preemptive events.
void RunWindowsEvents()
{
// A Windows event object.
HANDLE hEvent = CreateEvent(NULL, TRUE, FALSE, TEXT("Windows Event"));
// Create a task group and execute five tasks that wait for
// the event to be set.
task_group tasks;
for (int i = 0; i < 5; ++i)
{
tasks.run([&] {
// Print a message before waiting on the event.
wstringstream ss;
ss << L"\t\tContext " << GetExecutionContextId()
<< L": waiting on an event." << endl;
wcout << ss.str();
// Wait for the event to be set.
WaitForSingleObject(hEvent, INFINITE);
// Print a message after the event is set.
ss = wstringstream();
ss << L"\t\tContext " << GetExecutionContextId()
<< L": received the event." << endl;
wcout << ss.str();
});
}
// Wait a sufficient amount of time for all tasks to enter
// the waiting state.
Sleep(1000L);
// Set the event.
wstringstream ss;
ss << L"\tSetting the event." << endl;
wcout << ss.str();
SetEvent(hEvent);
// Wait for all tasks to complete.
tasks.wait();
// Close the event handle.
CloseHandle(hEvent);
}
int wmain()
{
// Create a scheduler policy that allows up to two
// simultaneous tasks.
SchedulerPolicy policy(1, MaxConcurrency, 2);
// Attach the policy to the current scheduler.
CurrentScheduler::Create(policy);
wcout << L"Cooperative event:" << endl;
RunCooperativeEvents();
wcout << L"Windows event:" << endl;
RunWindowsEvents();
}
[ 코드1. event 와 Windows API 이벤트 객체와의 차이 ]
event 의 경우 5 개의 작업 중 동시에 2개가 수행되도록 하여 2 개의 작업이 기다리고 있을 때, 기다리는 스레드 자원은 다른 작업을 하게 됩니다. 이것이 바로 협력적인 스케쥴링입니다.
반면에 Windows API 의 이벤트 객체를 사용할 경우, 2 개의 작업이 다시 시작될 때까지 스레드 자원은 낭비를 하게 됩니다.
[ 그림1. event와 Windows API 이벤트 객체와의 차이 예제 결과 ]
마치는 글
Concurrency Runtime 에서 제공하는 동기화 객체인 event 까지 알아보았습니다. 이렇게 해서 제공하는 모든 동기화 객체를 알아보았습니다.
동기화 객체도 알아보았으니 이제 사용자 정의 message block 을 구현할 준비가 다 된 것 같습니다.
다음 글에서는 제공하는 message block 이 외에 사용자가 구현사여 사용하는 message block 에 대해서 알아보겠습니다.
기본적으로 Asynchronous Agents Library( 이하 AAL ) 에서 제공하는 message block 들은 스레드에 안전합니다. 이 말은 내부적으로 동기화를 구현하고 있다는 말입니다.
하지만 Concurrency Runtime 을 이용한 동시 프로그래밍을 할 때 AAL 의 message block 을 사용하지 않고 일반적인 사용자 변수들을 사용할 수 있습니다. 하지만 이런 변수들은 동기화가 되지 않아 직접 동기화를 해 주어야 합니다.
이 때 Windows API 의 유저 모드 혹은 커널 모드의 동기화 객체를 사용할 수 있지만, Concurrency Runtime 에서 제공하는 동기화 객체를 쉽게 사용할 수 있습니다.
이번 글에서는 Concurrency Runtime 에서 제공하는 동기화 객체들에 대해서 알아보도록 하겠습니다.
critical_section
임계 영역을 의미하는 객체로, 어떤 영역을 잠그고 풀 수 있습니다. 잠긴 영역에 도달한 다른 스레드는 잠김이 풀릴 때까지 기다려야 합니다. 그러므로 해당 영역을 모두 사용한 후에는 다른 스레드도 사용할 수 있도록 풀어주어야 합니다.
이 기능은 Windows API 에서 제공하는 유저 모드 동기화 객체인 CRITICAL_SECTION 과 같은 기능을 합니다.
멤버 함수
생성자와 소멸자를 제외한 public 인 멤버 함수들에 대해서 알아보겠습니다.
void lock()
해당 영역을 잠급니다. 잠근다는 의미는 영역의 접근 권한을 획득한다는 의미도 있습니다. 잠긴 영역에 도달한 다른 스레드들은 잠김이 풀릴 때까지 기다려야 합니다.
bool try_lock()
해당 영역의 접근을 시도합니다. 이미 다른 스레드에 의해 잠겨있더라도 풀릴 때까지 기다리지 않고 반환합니다.
이미 다른 스레드에 의해 잠겨있다면 false 를, 아니면 true 를 반환합니다.
void unlock()
접근 영역의 접근 권한을 반환합니다. 즉, 잠금을 해제합니다. 이 함수가 호출된 후에 다른 스레드가 이 영역에 접근할 수 있습니다.
native_handle_type native_handle()
native_handle_type 은 critical_section 의 참조입니다. 결국, 이 함수는 자기 자신의 참조를 반환합니다.
범위 잠금
범위 잠금이란 코드 내의 블럭의 시작부터 블럭이 끝날 때까지 잠그는 것을 말합니다. 이것은 생성자에서 잠그고, 소멸자에서 잠금을 해제하는 원리( RAII – Resource Acquisition Is Initialization )로 구현되어 있으며, 굳이 unlock() 을 호출하지 않아도 된다는 편리함이 있습니다.
critical_section::scoped_lock
critical_section 객체를 범위 잠금 객체로 사용합니다. 생성자로 critical_section 의 참조를 넘겨주어야 합니다. 스택에 할당되고 가까운 코드 블럭이 끝날 때, 소멸자가 호출되어 잠금이 해제됩니다.
reader_writer_lock
reader_writer_lock 은 쓰기 접근 권한과 읽기 접근 권한을 구분하여 획득하고 잠글 수 있는 객체입니다.
한 스레드가 쓰기 접근 권한을 획득하여 잠긴다면, 다른 스레드의 모든 쓰기 / 읽기 접근 권한 획득시도가 실패하며 기다리게 됩니다.
만약 한 스레드가 읽기 접근 권한을 획득하여 잠긴다면, 다른 스레드가 읽기 접근 권한 획득 시도 시, 동시에 읽기 접근 권한을 획득 가능합니다.
위에 설명한 것처럼 2 가지 종류의 접근 권한이 있지만, 잠기는 것은 단 하나의 객체라는 것을 명심하셔야 합니다. 이 사실을 잊으면 헷갈릴 수 있습니다.
reader_writer_lock 의 이와 같은 기능은 Windows API 의 SRW( Slim Reader Writer ) 잠금과 유사합니다. 다른 점이 있다면 reader_writer_lock 은 기본 잠금이 쓰기 잠금으로 되어 있고, 잠겼을 때 다른 스레드들이 기다린 순서대로 접근 권한을 얻는다는 것입니다. 즉, Windows SRW 는 기본 잠금이라는 개념이 없고, 기다린 스레드들 중 어떤 순서로 접근 권한을 얻는지 알 수 없습니다.
멤버 함수
생성자와 소멸자를 제외한 public 인 멤버 함수들에 대해서 알아보겠습니다.
void lock()
기본 잠금으로 쓰기 접근 권한을 획득하고 잠급니다. 이미 다른 스레드에서 접근 권한을 획득하여 잠겨 있다면 해제될 때까지 기다립니다.
이 함수로 잠길 경우, lock() 과 읽기 접근 권한 획득 함수인 lock_read() 으로 접근 권한을 획득하려 하더라도 획득할 수 없고, 잠금이 해제될 때까지 기다리게 됩니다.
bool try_lock()
쓰기 접근 권한 획득을 시도합니다. 이미 다른 스레드가 접근 권한을 획득하여 잠겼을 경우에는 false 를 반환하고, 접근 권한을 획득하게 되면 true 를 반환합니다. 즉, 대기하지 않습니다.
void lock_read()
읽기 잠금으로 읽기 접근 권한 획득을 합니다. 다른 스레드에서 lock_read() 로 읽기 접근 권한 획득을 시도하면 이미 다른 스레드가 읽기 접근 권한을 획득하였다고 하더라도 동시에 읽기 접근 권한을 획득할 수 있습니다.
다른 스레드에서 lock() 으로 쓰기 접근 권한 획득을 시도한다면, 이 스레드는 모든 읽기 권한으로 인한 잠금이 해제될 때까지 기다리게 됩니다.
bool try_lock_read()
읽기 접근 권한 획득을 시도합니다. 이미 다른 접근 권한을 획득하여 잠겼을 경우에는 false 를 반환하고, 접근 궈한을 획득하게 되면 true 를 반환합니다. 즉, 대기하지 않습니다.
void unlock()
어떤 잠금이든 해제합니다.
범위 잠금
critical_section 과 마찬가지로 범위 잠금을 지원합니다.
reader_writer_lock::scoped_lock
critical_section 과 같습니다. 다른 점이 있다면 이 잠금 객체는 쓰기 잠금의 범위 잠금 객체입니다.
reader_writer_lock:scoped_lock_read
이 잠금 객체는 읽기 잠금의 범위 잠금 객체입니다.
마치는 글
Concurrency Runtime 에서 제공하는 동기화 객체은 critical_section 과 reader_writer_lock 에 대해서 알아보았습니다.
reader_writer_lock 이 동시 읽기 접근이 가능하므로 critical_section 보다는 상황에 따라 성능이 좋을 수 있습니다.
위의 예의 델리게이트들은 모두 void를 반환하고 파라미터가 없는 것인데 당연하듯이 반환 값이나 파라미터를 가질 수 있습니다.
델리게이트의 비동기 실행
델리게이트는 비동기 실행을 지원합니다. 비동기 실행은 처리를
요청한 후 종료를 기다리지 않은 호출한 곳으로 제어를 넘겨줍니다. 델리게이트 함수가 긴 시간을 필요로
하는 작업인 경우 비동기 실행을 이용하면 프로그램의 응답성을 높일 수 있습니다.
델리게이트의 비동기 실행은 스레드를 사용합니다. 이런 경우 비동기
실행을 할 때마다 스레드의 생성과 소멸에 부담을 느낄 수도 있지만 델리게이트는 닷넷의 기능을 잘 활용하여 스레드를 생성/삭제하지 않고 스레드 풀에 있는 스레드를 사용하므로 스레드 사용에 대한 부담이 작습니다.
비동기 실행을 할 때는 주의해야 할 점이 있습니다. 비동기 실행을
하는 경우 델리게이트에는 꼭 하나의 함수만 등록해야 합니다. 만약 2개
이상 등록하였다면 예외가 발생합니다.
비동기 실행은 BeginInvoke()를 사용하고, 만약 종료를 기다리고 싶다면 EndInvoke()를 사용합니다.
#include "stdafx.h"
#include <iostream>
using namespace System;
delegate void MyDele(void);
void myfunc(void)
{
System::Threading::Thread::Sleep(3000);
}
int main(array<System::String ^>
^args)
{
MyDele^
dele = gcnew MyDele(&myfunc);
Console::WriteLine(L"1");
IAsyncResult^
result = dele->BeginInvoke(nullptr,nullptr);
Console::WriteLine(L"2");
dele->EndInvoke(result);
Console::WriteLine(L"3");
getchar();
return 0;
}
위 코드를 실행하면 '2'가 찍힌 이후 3초가 지난 이후에 3이 찍힙니다.
참고
http://cppcli.shacknet.nu/cli:delegate
http://cppcli.shacknet.nu/cli:delegate%E3%81%9D%E3%81%AE2
이 글에서는 동기화 메커니즘으로 사용할 수 있는 join 과 multitype_join 에 대해서 알아보겠습니다. join 은 이전 글에서 소개한 choice 와 함께 동기화 메커니즘으로 사용할 수 있습니다.
join< _Type, _JType >
join 은 연결된 모든 message block 에서 message 를 받아올 때까지 기다리는 역할을 합니다. join 의 이 역할을 수행하기 위해서는 전달 함수인 receive() 와 함께 사용해야 합니다.
템플릿 매개변수인 _Type 은 message 의 타입입니다. 연결된 message block 들이 처리하는 message 타입으로 같은 타입이어야 합니다.
템플릿 매개변수인 _JType 은 join 의 타입입니다. join 은 2가지 종류가 있습니다. 하나는 greedy 이고, 다른 하나는 non_greedy 입니다.
_JType 에는 greedy 또는 non_greedy 를 사용할 수 있으며, 기본 템플릿 인자로 non_greedy 가 지정되어 있습니다.
join 타입은 다음과 같은 enum 형으로 정의되어 있습니다.
enum join_type {
greedy = 0,
non_greedy = 1
};
[ 코드1. join 타입 ]
두 타입의 join 모두 연결된 message block 들에서 message 를 받아올 때까지 기다리는 기능은 같습니다. 그렇다면 다른 점에 대해서 알아보겠습니다.
기본 인자로 지정된 non_greedy 타입은 연결된 message block 들 중 어떤 message block 이 먼저 message 를 받아올 수 있는 상태가 되더라도 연결된 모든 message block 들이 모두 message 를 받아올 수 있는 상태가 될 때까지 message block 에 받아올 수 있는 message 들을 유지합니다. 연결된 모든 message block 들에서 message 를 받아올 수 있을 때가 되면 한꺼번에 message 들을 받아옵니다.
반면 greedy 타입은 연결된 message block 들 중 어떤 message block 이 먼저 message 를 받아올 수 있는 상태가 되면 그 message 를 미리 받아옵니다. 이 때 이 message block 이 unbounded_buffer 라면 이로 인해 join 이 받아간 message 가 제거됩니다.
멤버 함수
생성자와 소멸자를 제외한 public 인 멤버 함수가 없습니다. 하지만 ISource 인터페이스를 재정의한 link_target() 을 사용할 수 있으며, 이 함수는 join 과 다른 message block 을 연결하는데 사용하게 됩니다.
가장 기본적인 생성자의 매개변수는 연결할 message block 의 개수입니다. 이 개수보다 실제로 연결된 message block 의 개수가 많으면 런타임에 에러를 발생하고, 적으면 교착상태에 빠지게 됩니다. 생성자의 매개변수로 지정된 message block 의 개수가 연결되어 message 를 받을 때까지 대기하기 때문입니다.
특징
message block 이 join 을 연결할 경우 몇 가지의 특징들이 있습니다.
하나의 message block 이 여러 개의 join 에 연결될 경우, 먼저 연결된 join 에 message 를 보냅니다.
연결된 join 들 중 greedy join 이 있을 경우 greedy join 에게 먼저 message 를 보냅니다.
연결된 join 들 중 greedy join 이 여러 개일 경우, 먼저 연결된 greedy join 에 message 를 보냅니다.
또한 어떤 mesage block 들은 join 과 함께 사용할 수 없습니다.
single_assignment 는 단 한번만 send() 가 적용되고 이 후의 send() 는 무시되기 때문에 join 은 single_assignment 으로부터 message 를 한번만 받을 수 있다. 두 번 이상은 받을 수 없기 때문에 무한대기하게 되어 교착상태에 빠진다.
transformer 는 join 에 연결한 후, 연결한 transformer 로 부터 message 를 받아가면 에러를 발생한다.
multitype_join< _TupleType, _JType >
multitype_join 은 join 과 같은 기능을 하지만 다른 종류의 message 들을 받을 수 있습니다. 그래서 템플릿 매개변수가 message 타입이 아닌 tuple 타입을 받습니다. tuple 에 사용할 수 있는 타입은 choice 에서 사용하는 tuple 의 특징과 같습니다.
multitype_join 의 타입은 join 과 마찬가지로 greedy 와 non_greedy 를 사용할 수 있습니다.
멤버 함수
생성자와 소멸자를 제외한 public 인 멤버 함수는 없고, 인터페이스를 재정의한 멤버 함수들이 있습니다.
헬퍼 함수
tuple 을 사용하는 choice 처럼 multitype_join 도 tuple 을 사용하므로 헬퍼 함수 없이는 굉장히 길고 복잡한 선언이 필요합니다.
그래서 다음과 같은 헬퍼 함수를 제공합니다.
unbounded_buffer< int > i;
unbounded_buffer< float > f;
unbounded_buffer< bool > b;
auto j = make_join( &i, &f, &b );
[ 코드2. 헬퍼 함수 make_join ]
예제
join 의 특징을 살펴볼 수 있는 간략한 예제를 보겠습니다.
시나리오
보통 온라인 게임에서 게임을 시작하게 되면 연결된 모든 클라이언트가 모두 로딩이 완료된 후 동시에 게임을 시작하게 됩니다. 그것을 join 을 이용해서 시뮬레이션 해보겠습니다.
unbounded_buffer, overwrite_buffer 그리고 single_assignment 와 같이 message 를 보관하는 버퍼 기능의 message block 들과, call, transformer 와 같이 지정된 함수형 객체를 수행하는 기능의 message block 들에 대해서 알아보았습니다.
이번 글에서는 message block 들의 상태를 기반으로 동작하는 message block 들 중 choice 에 대해서 알아보도록 하겠습니다.
choice< _TupleType >
choice 의 특징은 지정된 message block 들 중 가장 먼저 messge 를 가져올 수 있는 message block 을 가리키는 기능입니다. 다시 설명하면 어떤 message 를 받을 준비가 된 message block 들을 choice 에 지정한 후, 지정된 message block 들 중 가장 먼저 message 를 받은 message block 을 choice 가 가리키게 됩니다.
tuple 의 조건
choice 은 message 를 받을 준비가 된 message block 들을 지정할 때 tr1 의 tuple 을 사용합니다. 이 글의 주제가 tr1 이 아닌 만큼 tuple 에 대한 자세한 설명은 생략하겠습니다. 간략히 설명하면 std::pair 의 일반화된 객체라고 생각하시면 됩니다. std::pair 가 2개의 타입을 저장할 수 있다면 tuple 은 10개의 여러 가지 타입을 저장할 수 있습니다.
그래서 다른 message block 과 달리 템플릿 매개변수가 message 타입이 아닌 여러 message block 들의 타입을 저장할 수 있는 tuple 의 타입입니다.
하지만 아무 tuple 이나 사용할 수 있는 것이 아닙니다. 약간의 조건을 충족시키는 tuple 이어야만 합니다.
tuple 의 구성 요소로 source_type 이라는 typedef 를 가지고 있는 message block 들이어야 한다. ( message block 중 call 은 source_type 이 정의되어 있지 않기 때문에 사용할 수 없습니다. )
message block 들은 복사 생성자와 배정 연산자( = ) 의 사용을 금지( private )하고 있으므로 tuple 의 구성 요소로 포인터 타입을 사용해야 한다.
특징
choice 는 여러 message block 들 중 가장 먼저 message 를 받은 message block 을 가리킵니다. 그 말은 choice 는 tuple 로 지정된 message block 들의 index 를 가지고 있다는 말입니다.
그런데 그 index 를 저장하기 위한 변수로 내부적으로 single_assignment 를 사용합니다. 그 뜻은 single_assignment 는 단 한 번만 값을 저장할 수 있기 때문에 choice 는 가리키게 된 message block 의 index 를 변경할 수 없습니다. 즉, 일회성이라는 말이 됩니다.
receive() 로 choice 의 message 를 받아오면 지정된 message block 들 중 하나라도 message 를 받을 때까지 기다리다가 message 를 받은 message block 이 생기면 그 message block 의 index 를 반환합니다.
위의 특징을 응용하면 여러 message block 들 중 하나라도 message 를 받을 때까지 대기하는 기능으로 사용할 수 있습니다.
멤버 함수
생성자와 소멸자를 제외한 public 인 멤버 함수 중 인터페이스로 재정의된 함수들을 제외한 함수들입니다.
현재 message block 의 index 를 가지고 있는지 반환합니다. 내부적으로 single_assignment 의 has_value() 를 호출합니다.
size_t index()
가지고 있는 message block 의 index 를 반환합니다. 내부적으로 single_assignment 의 value() 를 호출하고 하고, 그 value() 는 receive() 를 사용하기 때문에 아직 index 를 가지고 있지 않다면 가질 때까지 대기하게 됩니다.
두 agent 에 육상 선수인 칼루이스와 우사인 볼트의 이름을 붙여보았습니다. 각 agent 는 수행이 완료되면 완료 message 를 single_assignment 에 보내고, choice 객체는 완료 message 가 먼저 도착한 message block 의 index 를 갖게 됩니다.
그 index 를 이용해 해당 agent 의 육상 선수 이름을 출력합니다.
이 예제의 결과는 스케쥴링에 따라 다르기 때문에 실행할 때마다 결과가 다를 수 있습니다.
[ 그림1. choice 를 사용한 먼저 수행된 agent 판별 예제 ]
마치는 글
이번에는 tuple 을 이용하는 choice 에 대해서 알아보았습니다. Visual studio 2010 에서 지원하는 C++0x 문법을 사용하면 좀 더 쉽게 사용할 수 있습니다.
transformer 는 지난 글에서 알아본 call 과 유사하나 좀 더 유연합니다. call 과 비교해서 보시고, call 과 transformer 를 언제 사용해야 할지 구분해 보시기 바랍니다.
transformer< _Input, _Output >
transformer 는 call 과 마찬가지로 지정된 함수, 함수 객체를 수행하는 역할을 합니다. 하지만 call 과는 확실히 다릅니다. 이름에서도 알 수 있듯이 message 를 변환하는 기능을 가지고 있습니다. 이 기능이 call 과 어떻게 다른지 알아보겠습니다.
특징
transformer 의 특징 중 첫째는 결과를 반환한다는 것입니다. 변환하는 기능을 가지고 있기 때문에 변환된 값을 내보내 주어야 하기 때문입니다. 템플릿 매개변수를 보고 이미 눈치채신 분도 있겠지만, transformer 를 선언할 때 입력되는 매개변수의 타입과 반환 타입을 명시해주어야 합니다.
이로 인해 내부적으로 call 과 다른 점은 반환 값을 보관하는 큐( queue ) 를 포함하고 있습니다. call 은 작업들을 순차적으로 처리하기 위한 작업 큐를 가지고 있고, transformer 는 작업 큐 뿐만 아니라 반환 값을 보관하는 큐도 가지고 있습니다.
반환 값을 보관하는 큐의 값을 꺼내오기 위해서 receive() 나 try_receive() 를 사용할 수 있습니다. 이 특징은 message 들을 전달, 보관하는 unbounded_buffer 와 비슷합니다. 하지만 unbounded_buffer 처럼 사용하시면 안됩니다.
그 이유는 transformer 는 두 가지 기능, 변환 함수를 수행하는 기능과 변환된 값을 내보내는 기능을 가지고 있는데 이 둘을 동시에 처리할 수 없기 때문입니다. 변환 함수를 수행하는 중인 transformer 에서 변환된 값( 반환 값 )을 얻어내려 시도해도 변환 함수를 수행 중일 때에는 변환된 값을 내어주지 않아 원하는 시기에 값을 얻어낼 수 없습니다.
원하는 시기에 값을 제대로 얻기 위해서는 변환된 값을 unbounded_buffer 나 overwrite_buffer 등과 같이 message 를 보관할 수 있는 message block 에 전달한 후, 그 message block 에서 값을 얻어와야 합니다.
두 번째 특징은 다른 message block 들과 연결하여 변환된 반환 값을 스스로 전달할 수 있다는 것입니다. ISource 인터페이스의 link_target() 을 사용하는데, 이 기능을 사용하여 절차적인 작업들을 잘게 나누어 순차적으로 처리할 수 있습니다. 이러한 메커니즘을 파이프라인( pipeline ) 이라고 합니다.
일반적인 C++ 프로그램에서도 파이프라인 개념은 이미 많이 사용되고 있습니다.
FunctionA( FunctionB( FunctionC() ) ) 와 같이 진행되는 처리도 파이프라인으로 볼 수 있습니다. 하지만 transformer 를 이용한 파이프라인은 이와 차이점이 있습니다. 바로 비 동기 처리가 가능하다는 것입니다.
하나의 파이프라인의 작업이 끝날 때까지 대기하지 않기 때문에, 여러 파이프라인의 작업이 동시에 수행할 될 수 있습니다.
잠시 후, 이런 파이프라인을 이용하는 예제를 알아보도록 하겠습니다.
선언
template < class _Output, class _Input >
class transformer
[ 코드1. transformer 의 선언 ]
transformer 는 call 처럼 함수 타입을 지정할 수 없습니다.
transformer 는 std::tr1::function<_Output(_Input const&)> 로 함수 타입이 고정되어 있습니다.
예제
transformer 를 이용하여 파이프라인을 구성하여 처리하는 예제를 구현해보도록 하겠습니다.
시나리오
문자열을 꾸미는 작업을 각 단계별로 나누어 파이프라인을 구성하고, 이것을 비 동기로 처리하는 시나리오입니다.
VS.NET(VS2002)에서
MFC 프로젝트로 만들었던 프로그램을 VC++10 프로젝트로 변환하여 컴파일 했더니 에러가 발생하면서 아래의 경고가 나왔습니다.
C:\Program Files\Microsoft Visual Studio
10.0\VC\atlmfc\include\atlcore.h(35):#error This file requires _WIN32_WINNT to
be #defined at least to 0x0403. Value 0x0501 or higher is recommended.
에러 내용은 프로젝트에서 정의된 _WIN32_WINNT 버전이 0x403인데
atlcore.h는이버전이최소 0x0501 이상이되어야한다는것입니다.
그래서_WIN32_WINN를정의한 stdafx.h 파일을열어보니
#define _WIN32_WINNT 0x0400
되어 있었더군요. 그래서 일단 이것을 최신이 좋다라는 생각에 아래와
같이 했습니다. ^^;;
#define _WIN32_WINNT 0x0600
그랬더니 이제는 아래와 같은 에러가 나오더군요. -_-;
c:\program files\microsoft visual studio
10.0\vc\atlmfc\include\afxcmn3.inl(29): error C2065: 'CCM_SETWINDOWTHEME' : 선언되지
않은 식별자입니다.
그래서 바로 구글링 들어갔습니다.
쉽게 저와 같은 에러가 나와서 질문을 올린 글을 찾았고 답변도 보았습니다.
문제 해결은 stdafx.h 파일에 정의된 버전의 숫자를 아래와 같이
하면 된다고 하더군요
// Modify the following defines if you have
to target a platform prior to the ones specified below.
// Refer to MSDN for the latest info on corresponding values for different
platforms.
#ifndef WINVER // Allow use of features specific to Windows 95 and Windows NT 4
or later.
#define WINVER 0x0501 // Change this to the appropriate value to target Windows
98 and Windows 2000 or later.
#endif
#ifndef _WIN32_WINNT // Allow use of features specific to Windows NT 4 or
later.
#define _WIN32_WINNT 0x0501 // Change this to the appropriate value to target
Windows 98 and Windows 2000 or later.
#endif
#ifndef _WIN32_WINDOWS // Allow use of features specific to Windows 98 or
later.
#define _WIN32_WINDOWS 0x0501 // Change this to the appropriate value to target
Windows Me or later.
#endif
#ifndef _WIN32_IE // Allow use of features specific to IE 4.0 or later.
#define _WIN32_IE 0x0500 // Change this to the appropriate value to target IE
5.0 or later.
#endif
이렇게 하니 문제 없이 빌드가 성공 되었습니다.
주위에서 VC++의 새로운 버전이 나와도 쉽게 사용하지 못하는 경우가
오래 전에 만들었던 프로젝트를 포팅 할 수 없어서 이전 버전을 어쩔 수 없이 사용한다는 이야기를 종종 듣습니다.
그러나 저는 운이 좋아서인지 2002버전부터 순차적으로 새 버전의 VC++을 사용할 수 있어서 VC++6에서 VS2002로 넘어갈 때만 빌드 문제를 겪었습니다.
그래서 이런 포팅에 대한 문제는 잘 알지 못합니다. 이번에는 예전에
만들었던 코드를 C++0x 코드로 바꾸고 싶어서 오래 전에 만들었던 프로젝트를 VC++ 10로 포팅하면서 정말 정말 오랜만에 이런 문제를 겪어 보게 되고 해결 방법을 포스팅 할 수 있었습니다.