LangChain: твой универсальный конструктор для работы с LLM
Сегодня появляется все больше и больше приложений на основе больших языковых моделей — условным чат-ботом в Telegram уже никого не удивить. В рамках обучения в магистратуре AI Talent Hub мне не раз приходилось разрабатывать такие приложения с использованием ChatGPT или GigaChat. В этой статье я расскажу о полезном инструменте для работы с LLM - мы рассмотрим главные возможности фреймворка LangChain, а также методы мониторинга и проверки качества существующего приложения с ИИ.
Пока все ждут новую бету iOS 26, вышла другая бета, а ещё вот что стало известно о грядущих прошивках. Apple запустила рекламу к акции для учащихся и удалила её, зато в ЕС теперь исполняет два закона, но также внезапно ограничивает европейцев. Как прошла премьера фильма «F1» от Apple и что интересного вокруг фильма. А также множество судов и слухов о грядущих продуктах компании: от складных до разноцветных iPhone и новых наушников. Погнали к интересным новостям за прошедшую неделю!
Перейти к новостямНазванная в честь выдающегося американского астронома Веры К. Рубин, которая нашла убедительные доказательства существования огромного количества невидимой материи, известной как тёмная материя, новая научная установка, совместно финансируемая Национальным научным фондом США и Управлением науки Министерства энергетики США, выпустила первые полные изображения, снятые камерой LSST.
Читать далееВсем привет! На связи снова Илья Криволапов — системный аналитик в SENSE, где мы трудимся на проекте одного из цветных банков РФ. Работаю в профессии уже пятый год и, несмотря на мою фамилию, с продом у нас в целом тёплые отношения.
Помимо боевых задач, я преподаю курс «Хранение и обработка больших объемов данных» и за это время накопил немало практических кейсов и наблюдений. Всё это добро я решил не держать при себе и собрал самое полезное в виде ультимативного гайда по оптимизации и грамотному проектированию баз данных с расчетом на масштабирование, который сейчас публикую на Хабре.
Цикл состоит из 3 частей. В первой мы обсудили два базовых подхода к масштабированию БД: вертикальный и горизонтальный. Поговорили о плюсах, минусах и о том, как делать точно не стоит.
Во второй части – то есть сейчас – мы нырнём глубже в мир горизонтального масштабирования и разберем три первых способа шардирования: по диапазону, по хэшу и по географическим зонам. Я расскажу, как каждый из них работает, где пригодится и в каких случаях может дать сбой.
Материал по-прежнему будет полезен всем, кто заботится о «здоровье» базы данных: DBA, архитекторам, DevOps-инженерам, аналитикам и разработчикам.
Готовы продолжать? Тогда поехали!
Читать далееВсем привет! Меня зовут Воляница Елизавета, я магистрант ИТМО по программе Искусственного интеллекта AI Talent Hub и по совместительству backend-разработчик на маркетплейсе. В основном я занимаюсь проектированием архитектуры, декомпозированием задач и написанием кода для различных систем. Но причём здесь графический дизайн?
Недавно, когда у меня появилась та самая гениальная идея для того самого стартапа, который «ну 100% выстрелит», я столкнулась с тем, что нужно не только проектировать архитектуру и писать код. Тогда мой дизайн выглядел как-то так:
Читать далееНачало дня не просто задает настрой на день вперед. Если каждый день начинается с борьбы и дискомфорта, то это больше напоминает выживание, а не жизнь. Особенно когда весь этот заряд негатива несется с собой на работу или взрывается дома, не привнося конструктивных решений. Поэтому и был собран этот протокол простых и доступных рекомендаций для бодрого старта с самого утра.
Читать далееБыло довольно любопытно обнаружить статью 1988 про AI от Родни Брукса (известного робототехника), которая один-в-один повторяет все элементы хайповых рассуждений 2025 года :) Решил перевести и поделиться.
Читать далееВнедрение искусственного интеллекта влияет на все аспекты нашей жизни: от поиска информации, до управления городами и принятия бизнес-решений.
Но за красивыми интерфейсами, генеративными ответами и автоматизацией процессов скрывается растущая, буквально ненасытная потребность в энергии. И дело не только в счетах за электричество.
Последствия для окружающей среды могут быть весьма серьезными. По мере развития ИИ-моделей, которые становятся все более сложными, растет потребление природных ресурсов. Вопрос в том, сможем ли мы прокормить наше ИИ-детище без ущерба себе и планете?
Читать далееВсем привет! Электронная почта сегодня — не просто канал связи. Для OSINT-расследователя это отправная точка, ведущая к сети данных: техническим метаданным, следам в утечках, связанным аккаунтам и даже рекламным профилям. В этой статье мы разберем как провести глубокий анализ почты, начиная от заголовка и заканчивая ADINT. Ищем цифровые следы, изучаем домены и никнеймы, проверяем email на компрометацию и отслеживаем пиксели. За подробностями добро пожаловать под кат!
Читать далееТипичная проблема в сетях: дисбаланс между продажами и товарными запасами. И для этого есть та самая волшебная таблетка. Важно видеть и считать коммерческие показатели, иначе бизнес не справится с конкуренцией. В статье на примерах расскажу, как аналитика помогает аптечным сетям.
Читать далееПолная версия платной статьи, публикуется с разрешения автора. Первая часть здесь.
В этой части поговорим о сложностях, с которыми столкнулась команда при лавинообразном росте нагрузки, как разваливался бекенд, а архитекторы из AWS пожимали плечами.
5. Инженерные вызовы
Рост нагрузки и его влияние на выбор технологий
Тип технологических решений, которые принимает команда, диктуется в первую очередь паттернами чтения и записи (Cursor всю дорогу синхронизирует струкутру проектов от миллионов пользователей без перерыва, об этом говорили в первой части. Прим. пер.):
Работа с кодом: транзакции с низкой задержкой. Для фичей, связанных с кодом (дополнения по tab'у, индексация, пересчет хеш-деревьев), рабочая нагрузка представляет собой череду чтений и записи. Задержка для этих операций должна быть как можно ниже. Изначально Cursor использовал Pinecone для семантической индексации и поиска, но затем перешел на Turbopuffer.
Также важно иметь серверы поближе к пользователю. Рабочие нагрузки распределены по нескольким регионам, таким как западное и восточное побережье США, Великобритания, Европа, Япония.
Читать далееВ этом практическом руководстве, мы познакомимся с Kubernetes (K8s) с точки зрения пентестера, а именно с основами, терминологией и методами исследования экземпляров Kubernetes.
Читать далееЯ закончил московский политех (ранее МГТУ “МАМИ”) по специальности "конструктор-технолог литейного производства" с красным дипломом. В 2010 году пошел работать в Роскосмос.
Читать далееПривет, Хабр!
Сегодня говорим о том, что в какой‑то момент словит почти каждый разработчик, особенно если вы не просто пишете скрипты, а строите проекты — будь то Django, Flask или кастомная архитектура с бизнес‑логикой в отдельных слоях. Речь про круговые импорты: они не объявляют о себе заранее, не фейлят весь проект громко и сразу, но подкрадываются исподтишка. И вот вы уже сидите с ошибкой ImportError: cannot import name ... или AttributeError, гуглите часами, тасуете импорты туда‑сюда и ловите дежавю — кажется, это уже было, но где?
Читать далееТема перехода на PostgreSQL весьма популярна, и почти на каждой конференции по PG обязательно есть парочка докладов на эту тему. Почему же эта тема до сих пор злободневна?
Когда мы начинали свой блог здесь на Хабре, наша первая статья была посвящена как раз задаче перевода больших баз данных MSSQL –> PostgreSQL. И первой причиной, из-за которой компании решаются на переход мы называли законодательство. А именно, необходимость для государственных и окологосударственных организаций, чьи информационные системы относятся к значимым объектам критической информационной инфраструктуры (ЗОКИИ) переводить свою работу на отечественное ПО. Прошло два года. И это всё еще основная причина.
Это не будет инструкция в стиле «делай раз», «делай два». Это будет про то, что большие базы в принципе очень тяжело и рискованно передвинуть (СУБД, платформа, окружение,…). И мы предлагаем собственный метод, как это сделать с гарантией отсутствия простоев бизнеса. Даже если что-то пойдет не так в «новой» системе, пользователи не должны страдать, а бизнес простаивать. Это главное!
Читать далееПризнайтесь, вы тоже каждый раз делаете сразу несколько макетов под разные платформы и в ужасе ждете от них обновлений, потому что опять нужно всё перестраивать под новые гайды? Тогда это статья для вас.
Читать далееКосмос бесконечен, полон звёзд и планет, и, казалось бы, должен кишеть жизнью. Миллиарды галактик, триллионы звёзд, бесчисленные миры - вероятность того, что мы одиноки во Вселенной, кажется исчезающе малой. И всё же, несмотря на десятилетия поисков, мы не нашли ни малейшего следа инопланетных цивилизаций. Ни радиосигналов, ни загадочных космических артефактов, ни визитов зелёных человечков. Этот диссонанс между ожидаемой обитаемостью космоса и его оглушительной тишиной получил название парадокса Ферми. Одно из объяснений этой загадки - гипотеза "тёмного леса", предложенная китайским писателем Лю Цысинем, которая рисует космос как место, где цивилизации скрываются, боясь быть обнаруженными.
Читать далееВ январе 1947 года Тьюринг отправился в Америку в турне по ознакомлению с мейнфреймами с электронным хранилищем программ, а по возвращении 20 февраля 1947 года выступил с лекцией в Лондонском математическом обществе. В этот день в зале Королевского астрономического общества в Берлингтон-хаусе на улице Пикадилли в Лондоне он впервые публично рассказал о своем видении компьютерного интеллекта — «машинах, способных учиться на собственном опыте».
Читать далееНедавно меня заинтересовала такая задача: как лучше всего определить, что в строке есть гласная?
Казалось бы, тривиальный вопрос, правда?
Но, начав разбираться, я осознал, что задача гораздо глубже. Я бросил себе вызов: придумать как можно больше способов обнаружения гласной. Я даже попросил присоединиться ко мне нескольких друзей. Какой способ самый быстрый? Каким никогда не стоит пользоваться? Какой самый умный? Какой самый удобочитаемый?
В этом посте я рассмотрю 11 способов обнаружения гласных, алгоритмический анализ, дизассемблирование байт-кода Python, реализацию CPython и даже исследую опкоды скомпилированного регулярного выражения. Поехали!
Читать далееSpring AI, который только недавно получил первую стабильную версию, уже предоставляет довольно много возможностей для работы с RAG (retrieval augmented generation).
Благодаря этому подходу нейросеть перед тем, как дать ответ на запрос пользователя, выполнит поиск подходящей информации в векторном хранилище. Причём каждый документ хранится не в виде текста, а в виде массива чисел (т.н. «векторов»).
Процесс преобразования различных документов в такой векторный формат выполняется опять же с помощью LLM и называется embedding («встраивание»). Хорошая новость заключается в том, что всё это можно легко сделать с помощью Spring AI.
Читать далее