TaskSchedulerDocs/task_8h_source.html

 // ***********************************************************************
 // Assembly         : task_scheduler
 // Author           : viknash
 // ***********************************************************************
 // <copyright file="task.h" >
 //     Copyright (c) viknash. All rights reserved.
 // </copyright>
 // <summary></summary>
 // ***********************************************************************
 #pragma once

 #include <atomic>
 #include <cinttypes>
 #include <vector>

 #include "memory.h"
 #include "meta.h"
 #include "print.h"
 #include "types.h"
 #include "profile.h"

 namespace task_scheduler
 {

     class base_task_events
     {
     public:
         virtual void before_scheduled(thread_num_t _scheduled_on_num_workers) = 0;
         virtual void after_run() = 0;
     };

     template < class TMemInterface > class base_task_graph;
     template < class TMemInterface > class base_thread_pool;
     template < class TMemInterface > struct base_thread;
     template < class task_type, class TMemInterface > struct base_sub_graph;

     template < class TMemInterface > class base_task : public TMemInterface, public base_task_events
     {
       public:

         typedef base_task< TMemInterface > task_type;
         typedef base_thread< TMemInterface > thread_type;
         typedef base_task_graph< TMemInterface > task_graph_type;
         typedef base_sub_graph< task_type, TMemInterface > sub_graph_type;
         typedef std::basic_string< tchar_t, std::char_traits< tchar_t >, stl_allocator< tchar_t, TMemInterface > > string_type;
         typedef std::vector< string_type, stl_allocator< string_type, TMemInterface > > string_vector;
         typedef std::vector< task_type *, stl_allocator< task_type *, TMemInterface > > task_vector;
         typedef base_thread_pool< TMemInterface > thread_pool;
         typedef std::function< void() > function_type;
         typedef int64_t rank_type;
         typedef std::vector< function_type > task_work_vector;
         typedef thread_index_t< TMemInterface > thread_index_type;

         typedef lock_free_node_dispenser< function_type *, TMemInterface > work_memory_allocator_type;
         typedef lock_free_queue<
             multi_producer_multi_consumer< function_type *, TMemInterface, work_memory_allocator_type >,
             function_type *, TMemInterface, work_memory_allocator_type * >
             work_queue_type;

         enum priority_selector
         {
             realtime,
             high,
             normal,
             low,
             num_priority
         };

         struct debug_container
         {
             const tchar_t* priority_to_string(priority_selector _priority) const;

             string_type task_name;
             string_vector dependent_task_names;
         };

         struct transient_container
         {
             transient_container();
             ~transient_container();

             std::atomic_int64_t start_gate;
             work_queue_type *work_queue;
             work_memory_allocator_type work_allocator;
             std::atomic_int64_t num_working;
             profile::time task_time;
             std::atomic_int64_t num_runned;
             uint32_t minimum_batch_size;
         };

         struct persistent_container
         {
             persistent_container();
             ~persistent_container();

             priority_selector task_priority;
             task_vector parent_tasks;
             task_vector dependent_tasks;
             task_vector kick_tasks;
             sub_graph_type *sub_graph;
             rank_type rank;
             uint64_t thread_affinity;
             task_work_vector task_work;
             thread_num_t num_workers;
         };

         base_task(task_graph_type &_task_graph);
         virtual ~base_task();
         void set_thread_affinity(thread_mask_int_t _mask);
         void set_thread_exclusion(thread_mask_int_t _mask);
         void set_num_workers(thread_num_t _num_workers);
         void set_num_workers(percentage_t _percentage_workers);
         void kick_dependent_tasks();
         bool add_task_parallel_work(function_type _work_function);
         bool link_task(task_type *_next_task);
         bool operator()();
         virtual thread_num_t get_recommended_num_workers();
         debug_container debug;
         transient_container transient;
         persistent_container persistent;
         task_graph_type &task_graph;

         thread_unsafe_access_storage add_task_parallel_work_detector;

     protected:
         // Overridable functions
         virtual bool run() = 0;
         virtual void before_scheduled(thread_num_t _scheduled_on_num_workers);
         virtual void after_run();

     };

     template < class TMemInterface >
     const tchar_t* base_task< TMemInterface >::debug_container::priority_to_string(priority_selector priority) const
     {
         static const tchar_t *priority_to_string[] = {_t("REALTIME"), _t("HIGH"), _t("NORMAL"), _t("LOW")};

         return priority_to_string[uint32_t(priority)];
     }

     template < class TMemInterface >
     base_task< TMemInterface >::persistent_container::persistent_container()
         : task_priority(normal)
         , sub_graph(nullptr)
         , rank(0)
         , thread_affinity(0)
         , num_workers(std::numeric_limits<thread_num_t>::max())
     {
     }

     template < class TMemInterface > base_task< TMemInterface >::persistent_container::~persistent_container() {}

     template < class TMemInterface >
     base_task< TMemInterface >::transient_container::transient_container()
         : work_queue(nullptr)
         , num_working(0)
         , minimum_batch_size(1)
     {
         using namespace std::chrono_literals;

         task_time = 0ms;
         work_queue = new work_queue_type(&work_allocator);
     }

     template < class TMemInterface > base_task< TMemInterface >::transient_container::~transient_container()
     {
         assert(work_queue);
         delete work_queue;
         work_queue = nullptr;
     }

     template < class TMemInterface > void base_task< TMemInterface >::set_thread_affinity(thread_mask_int_t _mask)
     {
         task_graph.set_task_thread_affinity(this, _mask);
     }

     template < class TMemInterface > void base_task< TMemInterface >::set_thread_exclusion(thread_mask_int_t _mask)
     {
         task_graph.set_task_thread_exclusion(this, _mask);
     }

     template < class TMemInterface > void base_task< TMemInterface >::set_num_workers(thread_num_t _num_workers)
     {
         task_graph.set_num_workers(this, _num_workers);
     }

     template < class TMemInterface > void base_task< TMemInterface >::set_num_workers(percentage_t _percentage_workers)
     {
         task_graph.set_percentage_of_workers(this, _percentage_workers);
     }

     template < class TMemInterface >
     base_task< TMemInterface >::base_task(task_graph_type &_task_graph)
         : task_graph(_task_graph)
     {
     }

     template < class TMemInterface >
     bool base_task< TMemInterface >::operator()()
     {
         profile::task_scoped_instrument profile_point(profile::task_param(nullptr, debug.task_name.c_str(), nullptr, debug.task_name.c_str()));
         return this->run();
     }

     template < class TMemInterface > base_task< TMemInterface >::~base_task() { persistent.task_work.clear(); }

     template < class TMemInterface > void base_task< TMemInterface >::kick_dependent_tasks()
     {
         // Reduce queue rank of queue that the current task is running on
         task_graph.pool.queue_rank[persistent.task_priority][task_graph.pool.get_current_thread()->thread_index]
             .fetch_sub(persistent.rank);

         // Queue dependent tasks only when their start gates are 0
         // i.e. all parent tasks have been executed

         // If we are scheduling many tasks at once search for the next best ranked queue, starting from just after the
         // queue that was just scheduled
         reduce_starvation(new_search_index) thread_index_type best_search_index =
             task_graph.pool.get_current_thread()->thread_index;

         for (auto dependent_task : persistent.dependent_tasks)
         {
             if (--dependent_task->transient.start_gate == 0)
             {
                 thread_num_t requested_workers = dependent_task->get_recommended_num_workers();
                 uint32_t dependent_task_priority = dependent_task->persistent.task_priority;

                 //Search for best threads to run on only we do not require all workers
                 if (requested_workers < task_graph.pool.num_threads)
                 {
                     dependent_task->before_scheduled(requested_workers);

                     // Find lowest ranking queue, aka best queue and increment its rank with dependent task rank
                     thread_type *best_thread = nullptr;
                     rank_type best_rank = std::numeric_limits< rank_type >::max();
                     do
                     {
                         best_thread = nullptr;
                         best_rank = std::numeric_limits< rank_type >::max();
                         thread_index_type current_thread_index = best_search_index;
                         for (thread_num_t iterations = 0; iterations < task_graph.pool.num_threads;
                             ++current_thread_index, ++iterations)
                         {
                             if (!current_thread_index.is_set(dependent_task->persistent.thread_affinity))
                                 continue; // Skip threads the task should not run on

                             int64_t current_thread_rank =
                                 task_graph.pool.queue_rank[dependent_task->persistent.task_priority][current_thread_index]
                                 .load();
                             if (current_thread_rank < best_rank)
                             {
                                 best_rank = current_thread_rank;
                                 best_thread = task_graph.pool.threads[current_thread_index];
                             }
                         }
                     } while (
                         !task_graph.pool.queue_rank[dependent_task->persistent.task_priority][best_thread->thread_index]
                         .compare_exchange_weak(best_rank, best_rank + dependent_task->persistent.rank));

                     // Push task into the best queue
                     uint32_t current_task_priority = dependent_task_priority;
                     do
                     {
                     } while (!best_thread->task_queue[current_task_priority]->push_back(dependent_task) &&
                         ++current_task_priority < task_type::num_priority);

                     ts_print("schedule " << dependent_task->debug.task_name << " -> "
                         << uint32_t(best_thread->thread_index));
                     // Wake up thread if its sleeping
                     best_thread->wake_up();

                     reduce_starvation(new_search_index) best_search_index = best_thread->thread_index;
                 }
                 else
                 {
                     //Schedule task on all threads
                     dependent_task->before_scheduled(task_graph.pool.num_threads);
                     for (thread_num_t current_thread_index = 0; current_thread_index < task_graph.pool.num_threads;
                         ++current_thread_index)
                     {
                         uint32_t current_task_priority = dependent_task_priority;
                         do
                         {
                         } while (!task_graph.pool.threads[current_thread_index]->task_queue[current_task_priority]->push_back(dependent_task) &&
                             ++current_task_priority < task_type::num_priority);
                         ts_print("schedule " << dependent_task->debug.task_name << " -> "
                             << uint32_t(task_graph.pool.threads[current_thread_index]->thread_index));
                     }

                     //Note: We do not modify best_search_index here
                 }
             }
         }

         // Stop kicking tasks when a request to pause has been received
         // If all tail kickers have paused, then request the threads to stop
         if (persistent.kick_tasks.size() && task_graph.pool.setup.request_exit == thread_pool::request_pause)
         {
             --task_graph.pool.setup.thread_sync;
             if (!task_graph.pool.setup.thread_sync)
             {
                 task_graph.pool.setup.request_exit.store(thread_pool::request_stop);
                 task_graph.pool.wake_up();
             }
             return;
         }

         // Only Tail task_type Nodes should have kick tasks
         // kick tasks are Head Tasks for the next frame
         bool initializedSubGraph = false;
         for (auto kick_task : persistent.kick_tasks)
         {
             if (!initializedSubGraph)
             {
                 task_graph.setup(kick_task->persistent.sub_graph);
                 initializedSubGraph = true;
             }
             uint64_t start_gate = kick_task->transient.start_gate.load();
             ts_assert(start_gate == 0);
             task_graph.queue_task(kick_task);
         }
     }

     template < class TMemInterface > bool base_task< TMemInterface >::link_task(task_type *_next_task)
     {
         return task_graph.link_task(this, _next_task);
     }

     template < class TMemInterface >
     bool base_task< TMemInterface >::add_task_parallel_work(function_type _work_function)
     {
         thread_unsafe_access_guard guard(add_task_parallel_work_detector);
         assert(transient.num_working == 0);
         persistent.task_work.push_back(_work_function);
         transient.work_queue->push_back(&persistent.task_work.back());
         return true;
     }

     template < class TMemInterface >
     void base_task< TMemInterface >::before_scheduled(thread_num_t _scheduled_on_num_workers)
     {
         ts_unused(_scheduled_on_num_workers);
     }

     template < class TMemInterface >
     void base_task< TMemInterface >::after_run()
     {
         //Repopulate task parallel work functions for next run
         for (auto &work : persistent.task_work)
         {
             transient.work_queue->push_back(&work);
         }
     }

     template < class TMemInterface >
     thread_num_t base_task< TMemInterface >::get_recommended_num_workers()
     {
         return persistent.num_workers;
     }

 };
task_scheduler::base_thread_pool::wake_up
void wake_up(thread_num_t _num_threads_to_wake_up=max_num_threads, uint64_t _thread_affinity_mask=std::numeric_limits< uint64_t >::max())
Wakes up.
Definition: threadpool.h:191

task_scheduler::base_task::set_num_workers
void set_num_workers(thread_num_t _num_workers)
Sets the number workers.
Definition: task.h:341

task_scheduler::base_thread_index
Definition: types.h:66

task_scheduler::base_task::persistent_container::kick_tasks
task_vector kick_tasks
The kick tasks
Definition: task.h:174

task_scheduler::base_thread_pool::setup_container::thread_sync
std::atomic_uint32_t thread_sync
The thread synchronize
Definition: threadpool.h:73

task_scheduler::base_thread::wake_up
void wake_up()
Wakes up.
Definition: thread.h:206

task_scheduler::base_task::transient_container::work_queue
work_queue_type * work_queue
The work queue
Definition: task.h:122

task_scheduler::base_task::base_task
base_task(task_graph_type &_task_graph)
Initializes a new instance of the base_task class.
Definition: task.h:352

task_scheduler::base_task::task_graph
task_graph_type & task_graph
The task graph
Definition: task.h:267

task_scheduler::base_task_graph::queue_task
void queue_task(task_type *_task, thread_num_t _num_threads_to_wake_up=1)
Queues the task.
Definition: taskgraph.h:596

task_scheduler::base_task::~base_task
virtual ~base_task()
Finalizes an instance of the base_task class.
Definition: task.h:364

task_scheduler::base_task::transient_container::task_time
profile::time task_time
Total time spent running all work functions in this task
Definition: task.h:134

task_scheduler::base_task::transient_container::num_working
std::atomic_int64_t num_working
The number working
Definition: task.h:130

task_scheduler::base_task::transient_container::transient_container
transient_container()
Initializes a new instance of the base_task<TMemInterface>.transient_container struct.
Definition: task.h:313

task_scheduler::base_thread_pool::get_current_thread
thread_type * get_current_thread()
Gets the current thread.
Definition: threadpool.h:207

task_scheduler::base_task_graph::set_task_thread_exclusion
void set_task_thread_exclusion(task_type *_task, uint64_t _mask)
Sets the task thread exclusion.
Definition: taskgraph.h:479

task_scheduler
Class stl_allocator.
Definition: allocator.h:16

task_scheduler::base_task::after_run
virtual void after_run()
Callback is called after a task is run
Definition: task.h:505

task_scheduler::base_task::transient_container::num_runned
std::atomic_int64_t num_runned
Total number of times work function was called
Definition: task.h:138

task_scheduler::base_thread::thread_index
thread_index_type thread_index
The task queue
Definition: thread.h:81

task_scheduler::base_task_graph::pool
thread_pool & pool
The pool
Definition: taskgraph.h:285

task_scheduler::base_task_graph::link_task
bool link_task(task_type *_parent_task, task_type *_dependent_task)
Links the task.
Definition: taskgraph.h:636

std

task_scheduler::base_task::transient_container::~transient_container
~transient_container()
Finalizes an instance of the base_task<TMemInterface>.transient_container class.
Definition: task.h:324

task_scheduler::base_sub_graph
Struct base_sub_graph
Definition: task.h:38

task_scheduler::base_task::link_task
bool link_task(task_type *_next_task)
Links the task.
Definition: task.h:483

task_scheduler::stl_allocator
Definition: allocator.h:17

task_scheduler::base_task::debug_container::dependent_task_names
string_vector dependent_task_names
The dependent task names
Definition: task.h:98

task_scheduler::constrained
Class constrained.
Definition: types.h:25

task_scheduler::base_task_graph::setup
void setup(sub_graph_type *_sub_graph=nullptr)
Setups the specified sub graph.
Definition: taskgraph.h:307

task_scheduler::base_thread_index::is_set
bool is_set(thread_mask_int_t _other_mask)
Determines whether the specified other mask is set.
Definition: types.h:195

task_scheduler::base_thread_pool::setup_container::request_exit
std::atomic< state_selector > request_exit
The request exit
Definition: threadpool.h:77

task_scheduler::base_task::persistent_container::task_priority
priority_selector task_priority
The task priority
Definition: task.h:162

task_scheduler::scoped_enter_exit
Class scoped_enter_exit.
Definition: utils.h:140

task_scheduler::base_task::set_thread_affinity
void set_thread_affinity(thread_mask_int_t _mask)
Sets the thread affinity.
Definition: task.h:331

task_scheduler::base_task::persistent_container::thread_affinity
uint64_t thread_affinity
The thread affinity
Definition: task.h:186

task_scheduler::base_task::persistent_container
Struct persistent_container
Definition: task.h:148

task_scheduler::base_task::before_scheduled
virtual void before_scheduled(thread_num_t _scheduled_on_num_workers)
Callback is called when a task is scheduled
Definition: task.h:499

task_scheduler::base_thread_pool::setup
setup_container setup
The setup
Definition: threadpool.h:109

task_scheduler::base_task::persistent_container::sub_graph
sub_graph_type * sub_graph
The sub graph
Definition: task.h:178

task_scheduler::base_task::add_task_parallel_work
bool add_task_parallel_work(function_type _work_function)
Adds the task parallel work.
Definition: task.h:489

task_scheduler::base_task::transient_container::start_gate
std::atomic_int64_t start_gate
The start gate
Definition: task.h:118

task_scheduler::lock_free_node_dispenser< function_type *, TMemInterface >

task_scheduler::base_task::persistent_container::~persistent_container
~persistent_container()
Finalizes an instance of the base_task<TMemInterface>.persistent_container class. ...
Definition: task.h:310

task_scheduler::base_task::transient_container::work_allocator
work_memory_allocator_type work_allocator
The work allocator
Definition: task.h:126

task_scheduler::base_task::transient_container::minimum_batch_size
uint32_t minimum_batch_size
Calculated minimum batch size
Definition: task.h:142

task_scheduler::base_task::persistent_container::task_work
task_work_vector task_work
The task work
Definition: task.h:190

task_scheduler::base_task::add_task_parallel_work_detector
thread_unsafe_access_storage add_task_parallel_work_detector
The add task parallel work detector
Definition: task.h:272

task_scheduler::base_thread
Struct base_thread
Definition: task.h:37

task_scheduler::base_thread_pool::num_threads
thread_num_t num_threads
The number threads
Definition: threadpool.h:113

task_scheduler::base_task::debug_container::priority_to_string
const tchar_t * priority_to_string(priority_selector _priority) const
Priorities to string.
Definition: task.h:293

task_scheduler::base_task::set_thread_exclusion
void set_thread_exclusion(thread_mask_int_t _mask)
Sets the thread exclusion.
Definition: task.h:336

task_scheduler::base_task::debug_container::task_name
string_type task_name
The task name
Definition: task.h:94

task_scheduler::base_task::operator()
bool operator()()
Operator()s this instance.
Definition: task.h:358

task_scheduler::base_task::kick_dependent_tasks
void kick_dependent_tasks()
Kicks the dependent tasks.
Definition: task.h:366

task_scheduler::base_task::run
virtual bool run()=0
Calls the working function internally

task_scheduler::base_task::get_recommended_num_workers
virtual thread_num_t get_recommended_num_workers()
Gets the best number of workers for the task every frame
Definition: task.h:515

task_scheduler::base_task_graph::set_num_workers
void set_num_workers(task_type *_task, thread_num_t _num_workers)
Sets the number workers.
Definition: taskgraph.h:489

task_scheduler::multi_producer_multi_consumer
Definition: lockfreequeue.h:20

task_scheduler::base_task::debug_container
Struct debug_container
Definition: task.h:82

task_scheduler::lock_free_queue
Definition: lockfreequeue.h:235

task_scheduler::base_task_graph::set_percentage_of_workers
void set_percentage_of_workers(task_type *_task, float _percentage_workers)
Sets the percentage of workers.
Definition: taskgraph.h:495

task_scheduler::base_task
Class base_task.
Definition: task.h:44

task_scheduler::base_task_graph
Class base_task_graph.
Definition: task.h:35

task_scheduler::base_task::persistent_container::persistent_container
persistent_container()
Initializes a new instance of the base_task<TMemInterface>.persistent_container struct.
Definition: task.h:301

task_scheduler::base_task::debug
debug_container debug
The debug
Definition: task.h:255

task_scheduler::base_task_graph::set_task_thread_affinity
void set_task_thread_affinity(task_type *_task, uint64_t _mask)
Sets the task thread affinity.
Definition: taskgraph.h:466

task_scheduler::base_task::transient_container
Struct transient_container
Definition: task.h:104

task_scheduler::base_task::persistent_container::parent_tasks
task_vector parent_tasks
The parent tasks
Definition: task.h:166

task_scheduler::base_task::persistent_container::num_workers
thread_num_t num_workers
User set number of workers to use to run this task
Definition: task.h:194

task_scheduler::thread_unsafe_access_storage
Struct thread_unsafe_access_storage
Definition: utils.h:195

task_scheduler::base_thread_pool
Class base_thread_pool.
Definition: task.h:36

task_scheduler::base_task::persistent_container::rank
rank_type rank
The rank
Definition: task.h:182

task_scheduler::base_task::persistent_container::dependent_tasks
task_vector dependent_tasks
The dependent tasks
Definition: task.h:170

task_scheduler::base_task_events
Definition: task.h:28

task_scheduler::profile::task_param
Definition: profileitt.h:173

task_scheduler::base_task::persistent
persistent_container persistent
The persistent
Definition: task.h:263

task_scheduler::base_task::priority_selector
priority_selector
Enum priority_selector
Definition: task.h:70