Для кого. Для тех, кто хочет углубиться в технические аспекты своей работы, используя предиктивную аналитику на языке программирования. Для инженеров с любым уровнем знаний в области машинного обучения.
Почитать и не только: путеводитель по самым необычным библиотекам Москвы
В последнее время термин «библиотека» больше не ассоциируется с железным правилом запрета на стандартные номера и шум. Это связано с тем, что многие библиотеки в Москве буквально преобразились. Как и прежде, их основой является солидная коллекция книг, но это пространство для взаимодействия с контентом стало гибким, высокотехнологичным и ярким, где каждый может найти что-то интересное о себе и пообщаться с единомышленниками. Мы расскажем вам об одних из лучших современных библиотек Москвы.
Центральную библиотеку № 70 имени Шолохова в Преображенском районе называют «Библиотекой высокого полета». Когда был реализован проект «Точка развития», он был переоборудован и сделал аэрокосмическую тематику своей главной темой. Тематическая коллекция содержит как техническую, так и научную литературу, где можно узнать не только о вымышленных книгах, в которых главные герои покоряют небо, но и о профессиональных особенностях пилотов и авиаконструкторов.
В читальном зале нашлось место даже космическим кораблям и авиасимуляторам, работающим в настоящих кабинах самолетов Як-40. Кроме того, вы можете прочитать о реальных креслах самолетов и посмотреть различные модели самолетов и моделирование.
В зале библиотеки регулярно проводятся временные выставки авиационных книг, а в зале работают две постоянные выставки книг и иллюстраций Центрального музея российской авиации «МиГ». В библиотечном клубе проводятся занятия по моделированию для учащихся 10-16 лет.
Библиотека «Графические истории»
Библиотека № 227 в Северном Тушине была отремонтирована в феврале 2018 года — и приятно удивила местное население, особенно студентов и молодежь. Ее коллекция пополнилась комиксами — собранием графической литературы. Коллекция содержит более 770 наименований. Здесь также можно создавать собственные комиксы на специальных графических планшетах.
Оформление библиотеки соответствует ее тематике. Плакаты с комическими отрывками используются для украшения краев полок, стен и фасадных окон. В этом молодежном и отаку-пространстве, вдохновленном поп-артом, регулярно проводятся лекции по комиксам, мастер-классы современных художников, презентации графических романов, кинопоказы и аркадные игры. В библиотеке также находится студия «Манга» — японская манга.
Помимо коллекции графических книг, библиотека располагает фондом из 40 000 наименований книг, коллекцией настольных игр и виниловой лентой для записи пластинок на цифровые носители.
Библиотека Technoscience
Библиотека № 240 Хорошево-Мневники идеально подходит для тех, кто интересуется информатикой. Коллекция науки, техники и научной фантастики имеет высокотехнологичный вариант, а посетители библиотеки (как ученые, так и научные работники) регулярно проводят здесь лекции, мастер-классы, семинары и научные бои. Среди ключевых тем — Интернет вещей, технология протезирования (3D-печать), большие данные, искусственный интеллект, робототехника и спецэффекты в искусстве, кино и играх.
Книжный фонд библиотеки насчитывает более 30 000 экземпляров. На полках сборника научной фантастики «Читай будущее!». Книги расположены в особом порядке в соответствии со временем внедрения изобретений, предоставленных отечественными и зарубежными авторами. В коллекции «100 книг о технологиях» представлены издания, посвященные лучшим научно-техническим открытиям и их внедрению в повседневную жизнь.
Информационные баннеры «FictionMadeReal» и «TheFutureofTechnology» украшают стены читального зала, где можно ознакомиться с книгами из коллекции. Компьютерный класс, в котором также проводятся занятия для разных возрастных групп, оснащен новым оборудованием.
Среди авторов — инженеры, исследователи, основатели влиятельных факультетов и институтов, а также международные авторитеты в области анализа данных, машинного обучения и науки о данных.
Необходимые базовые навыки
Знание основ программирования: Python и SQL
Вы не сможете заниматься машинным обучением или наукой о данных без программирования на Python или R (Python — хорошее место для начала). Кроме того, большинство «классических» задач машинного обучения (решение бизнес-задач и манипулирование исходными числовыми/статистическими данными) требуют знания SQL. Основные рекомендации по их изучению можно найти в статье Самообразование в области науки о данных, которое проходит с нуля до более высокого уровня за два года.
Математика
Без достаточного уровня знаний математики невозможно сделать это хорошо. Однако эффективнее изучать математику постепенно, зная сначала цель применения математики.
Тем не менее, существует минимально необходимый базовый уровень: понимание производных (школьные программы по алгебре), понимание градиентов спуска (градиенты обычно объясняются в университетских курсах элементарного математического анализа, а также в курсах машинного обучения), базовые знания дискретной математики, теории вероятности и статистики.
Основные принципы теории вероятности хорошо объясняются в специализации «Математика для анализа данных». Последний год обучения по этой специальности включает минимальный курс теории вероятностей, который не требует знания уроков 2 и 3. Уроки 2 и 3 дают знания, которые помогут студентам понять градиентный спуск и изучить нейронные сети и другие инженерные методы. Что касается вышеупомянутых тем, мне очень нравится курс English Directional Mathematics for Machine Learning от Imperial College London.
Если вам трудно понять производные и ограничения (школьный материал, самые сложные предметы), если вы понимаете английский язык: очень рекомендую все уроки RobertGhrist. Я никогда не видел более интуитивного и ясного объяснения математики. Ищите курсы русского языка на coursera.org, а также бесплатные уроки математики на stepik.org.
Начальный уровень
Книги и статьи, рекомендуемый минимум
Datasmart (на русском языке) — отличный пример популярного метода машинного обучения. Эта книга хороша тем, что в ней показаны общие идеи в области науки о данных. По рекомендации друга я начал изучать область машинной науки о данных с этой книги. Я считаю, что это лучший способ познакомиться с этой областью и возможностями применения этих знаний. После ознакомления с python, pandas и scikit-learn полезно использовать эти инструменты для создания примеров из этой книги, чтобы получить необходимый практический опыт (за исключением примеров, основанных на линейном программировании, которые не включены). Часто требуются другие инструменты (и гораздо дешевле)).
Эти статьи и учебники обеспечивают отличную основу и навыки для изучения основ машинного обучения. В статьях также приводится хороший список дополнительных материалов. Есть также лекции, основанные на этих статьях (я не посещал лекции, так как субъективно они гораздо более эффективны). Для меня эти материалы дополнили онлайн-курс Воронцова (см. ниже). Осваивая курс и эти статьи так долго, у меня было достаточно времени, чтобы поработать над навыками применения этих методов, не изучая ничего другого. В этих статьях (тему 8 можно смело опустить) рассмотрим подробнее seaborn и вспомним, что синтаксис этих библиотек устарел (на самом деле полезно научиться понимать, как делать такие вещи, используя официальную документацию).
Книга Data Science from Scratch: First Principles with Python содержит обзор всех основных принципов науки о данных и показывает, как применять их самым простым способом на языке Python. В целом, большинство из них пересекаются со статьями о Datasmart (на мой взгляд, более интуитивно понятном, но в книге лучше представлены примеры на Python) или ODS. Главным достоинством книги является описание того, как использовать Python для решения проблем. Это помогает лучше понять язык программирования и само по себе представляет большую ценность.
Однако, возможно, книга могла бы заменить оба вышеупомянутых источника. В качестве альтернативы материал может быть интегрирован, другими словами, путем чтения одного и того же
Дополнительные печатные источники
Data Science for Business: what you need to know about data mining and data analysis thinking by Foster Provost (скачать можно здесь) — вероятно, лучший обзор всех основ машинного обучения в виде книги. Отличное дополнение к книге Datasmart на эту тему. Курс Воронцова «Обзор машинного обучения» (см. ниже) также охватывает большинство тем этой книги. В качестве дополнения к этому уроку мы читаем фрагменты…
Machine Learning, Flach — это превосходное изложение всех методов и их деталей, которое служит дополнением/расширением к материалам онлайн-курса. Как самостоятельный семинар, книга, пожалуй, немного суховата.
Обратите внимание, что все книги, написанные на английском языке, изначально читались в оригинале. Качество перевода не гарантируется. Также настоятельно рекомендуется попробовать оригинал, поскольку это даст вам уровень владения языком, необходимый для чтения документации программных библиотек, которые вам придется использовать для применения этих методов. Эта документация вообще не переведена на русский язык. Достичь этого базового уровня легче, чем кажется.
Курсы
Необходимый минимум
Обзор машинного обучения» Воронцова — охватывает все основные методы машинного обучения и необходимые базовые концепции. Знаний и умения применять все представленные методы достаточно для решения большинства бизнес-задач, связанных с машинным обучением. Если вы полностью освоите этот курс, вы сможете пропустить другие курсы начального уровня по машинному обучению. Однако после прохождения этого курса становится ясно, что вам необходимо улучшить свои навыки работы с Python, Pandas и scikit-learn.
Следующий шаг — полировка и углубление знаний
В машинном обучении половина успеха заключается в правильной подготовке данных для алгоритма и правильной формулировке решаемой задачи (целевой функции). Также важно научиться выполнять все шаги по созданию модели машинного обучения в оптимальном порядке. Все эти темы полностью освещены в курсе, записанном русскими, но на английском языке: https://www.coursera.org/learn/competitive-data-science. Не обращайте внимания на каггл — дано методы связаны с реальной работой. Этот урок поможет вам понять следующие мультфильмы
В статье ODS Community (см. выше) есть много ссылок на дополнительные ресурсы. Пожалуйста, проверьте их. На сайте сообщества вы также можете найти множество видеозаписей семинаров. Эти видео могут содержать очень полезные и базовые темы. Например, мы нашли полезными все презентации Алексея Натенкина, основателя сообщества («Прогнозирование временных рядов» — еще один пример).
Разные смежные концепции, которые необходимо знать
Необходимо четко понимать разницу между корреляцией и причинно-следственной связью. Не понимая этого, вы не сможете работать в качестве исследователя данных.
Когда вы проводите сравнительный анализ различных групп (например, рекламных кампаний, поведения людей и т.д.), вы можете попасть в «Парадокс Симпсона» (отличное видео). Важно понимать это, потому что вы должны защитить себя от его последствий. Хотя я знала об этом, я не всегда осознавала, что на самом деле имею с этим дело.
Кроме того, как гласит закон Гудхарта, поведение людей часто искажается с точки зрения целевой направленности. Знание последствий может дать направление для анализа различных явлений.
Другие полезные книги/ материалы
Существует множество статей на английском языке об использовании различных библиотек, большинство из которых носят ознакомительный характер и регулярно публикуются на сайте https: //towardsdatascience.com. В месяц можно свободно читать до трех статей.
Печально полное руководство Алекса Рейнхарта — прекрасный пример того, как не следует использовать математические методы проверки гипотез. Автор объясняет, что даже профессиональные ученые постоянно совершают ошибки.
Sebastian Raschka Python Machine Learning — это хороший набор фрагментов кода для начала работы. У автора также есть прекрасные статьи на самые разные темы.
Ранее я писал статью о том, как найти другие хорошие книги и уроки и выбрать лучшие и наиболее подходящие.
Необходимые технические знания
Git One требует, чтобы вы научились работать с одним кодом вместе с другими. Отличная, простая и бесплатная книга на английском языке — Ry’s Git Tutorial. На официальном сайте git также есть ряд бесплатных книг. Отличные визуальные объяснения различных концепций: http://ndpsoftware.com/git-cheatsheet.html
Https://www.practicaldatascience.org/は, отличная коллекция материалов по различным библиотекам и дополнительным инструментам. По сути, в ней приводится полный список того, что нужно знать для работы с наукой о данных, и обзор всех тем (раздел об облаке стоит читать в стороне, поскольку вы можете работать с аналогичными технологиями других поставщиков. (Это может быть разным).
Джоэл Грас описывает Python, линейную алгебру, математическую статистику, методы сбора, нормализации и обработки данных. Кроме того, он обеспечивает информационную базу для машинного обучения. Описаны математические модели и то, как они разрабатываются в k-модельном ключе.
TechnoScience: Библиотека о будущем
Технологические науки изучают историю технологий и применение человеком современных научных методов. Охватывается широкий спектр вопросов — от раннего развития базовых технологий для охоты, земледелия и сельского хозяйства (колодцы, луки, лопухи, ремни и т.д.) до применения ядерных технологий, биотехнологий, робототехники и информатики.
И может ли этот научный подход предсказать будущее? Это был вопрос, с которого началось осмысление программы «Научный взгляд на технонауку». В середине 2017 года библиотечные специалисты обратили свое внимание на концепцию Клауса Шваба о Четвертой промышленной революции. Эта идея охватывает период с 2015 по 2030-2035 годы. Это исследование легло в основу рабочей деятельности коллег в Москве.
Проект стартовал в феврале 2018 года в библиотеке 240 Северо-Западного округа Москвы. Куратором проекта в библиотеке стал руководитель Международного центра «Русь» доктор Юрий Черный.
Библиотека выбрала это направление в качестве профиля своей деятельности. По сути, команда создала «библиотеку будущего».
Модель фонда
Мы собрали специализированную коллекцию, моделью которой стала «100 технологий». На базе интернет-магазина Ozon.ru была создана одноименная библиография. Он состоит из 18 наименований.
- Современная технологическая революция, трансгуманизм, футурология, глобальная динамика, биографии выдающихся бизнесменов.
- Информационное общество.
- Интернет вещей.
- RFID-технологии.
- Искусственный интеллект.
- Виртуальная и дополненная реальность.
- Большие данные.
- Криптовалюта.
- Блокчейн.
- Экономика совместного потребления.
- Облачные технологии.
- Квантовые вычисления.
- Смартфоны.
- Беспилотный транспорт.
- Технологии аддитивного производства (3D-печать).
- Робототехника.
- Нанотехнологии.
- Биотехнологии.
Специализированные коллекции, сформированные благодаря этой модели, позволяют в значительной степени сосредоточиться на вариантах будущего на ближайшие 10-15 лет.
Реализация проекта
В течение двух с половиной лет обучения по программе «Технические науки» библиотека превратилась в открытую исследовательскую лабораторию. Для читателей организуется серия лекций, мастер-классов, открытых диалогов, лабораторий и научных баталий.
Указом Президента 2021 год объявлен Годом науки и техники. 812 от 25 декабря 2020 г. Основным направлением социально-культурной деятельности библиотеки в этом году является распространение научных и технических знаний. Поэтому опыт библиотеки Technoscience Library особенно полезен. Пока мероприятия библиотеки представлены в группах социальных сетей Вконтакте и Facebook, вы можете ознакомиться с программой подробнее, пока мероприятия библиотеки представлены в группах социальных сетей Вконтакте и Facebook.
Мы призываем вас использовать эту идею по-своему и создать отдельную библиотеку. Мы уже рассказывали вам о туристических библиотеках, включая все московские библиотеки. Москва. Вопросы библиотечного проекта сводятся к тому, что.