二分查找算法简介
二分查找(Binary Search),也称为折半查找,是一种高效的有序数组查找算法。其核心思想是通过不断将搜索区间减半,快速缩小目标值的可能范围,最终找到目标值或确定其不存在。该算法的时间复杂度为 O(log n),远优于顺序查找的 O(n),在处理大规模有序数据时优势显著。
17. 二分查找
题目描述: 给定一个升序排列的整数数组 nums 和一个目标值 target,找出目标值在数组中的索引。如果不存在,返回 -1。
解法:
算法流程:
- 定义 left、right 指针,分别指向数组的左右区间。
- 找到待查找区间的中间点 mid,找到之后分三种情况讨论:
- arr[mid] == target:说明正好找到,返回 mid 的值;
- arr[mid] > target:说明 [mid, right] 这段区间都是大于 target 的。因此舍去右边区间,往左边 [left, mid-1] 的区间继续查找,即让 right = mid - 1,然后重复步骤 2;
- arr[mid] < target:说明 [left, mid] 这段区间的值都是小于 target 的。因此舍去左边区间,在右边 [mid+1, right] 区间继续查找,即让 left = mid + 1,然后重复步骤 2。
- 当 left 与 right 错开时,说明整个区间都没有这个数,返回 -1。
C++ 算法代码:
class Solution {
public:
int search(vector<int>& nums, int target) {
int left = 0, right = nums.size() - 1;
while (left <= right) {
int mid = left + (right - left) / 2; // 防止数据溢出
if (nums[mid] < target)
left = mid + 1;
else if (nums[mid] > target)
right = mid - 1;
else
return mid;
}
return -1;
}
};
二分查找算法模板:
int left = 0, right = nums.size() - 1;
while (left <= right) {
int mid = left + (right - left) / 2; // 防止数据溢出
if (条件判断) left = mid + 1;
else if (条件判断) right = mid - 1;
else return 结果;
}
18. 在排序数组中查找元素的第一个和最后一个位置
题目描述: 给定一个按照升序排列的整数数组 nums,和一个目标值 target。找出给定目标值在数组中的开始位置和结束位置。如果数组中不存在目标值,返回 [-1, -1]。
解法:
算法思路: 使用二分思想,根据数据的性质,在某种判断条件下将区间一分为二,然后舍去其中一个区间,再在另一个区间内查找。
方便叙述,用 x 表示该元素,resLeft 表示左边界,resRight 表示右边界。
寻找左边界思路: 寻找左边界时需要注意以左边界划分的两个区间的特点:
- 左边区间 [left, resLeft - 1] 都是小于 x 的;
- 右边区间(包括左边界)[resLeft, right] 都是大于等于 x 的。
关于 mid 的落点,分为两种情况:
- 当 mid 落在 [left, resLeft - 1] 区间的时候,也就是 arr[mid] < target。说明 [left, mid] 都是可以舍去的,此时更新 left 到 mid + 1 的位置,继续在 [mid + 1, right] 上寻找左边界;
- 当 mid 落在 [resLeft, right] 的区间的时候,也就是 arr[mid] >= target。说明 [mid + 1, right](因为 mid 可能是最终结果,不能舍去)是可以舍去的,此时更新 right 到 mid 的位置,继续在 [left, mid] 上寻找左边界。
由此,就可以通过二分来快速寻找左边界。 注意:这里找中间元素需要向下取整。因为后续移动左右指针的时候,左指针 left = mid + 1 会向后移动,而右指针 right = mid 可能会原地踏步(例如剩下 1, 2 两个元素,left=1, right=2, mid=2。若向上取整则 mid=2,更新后 left,right,mid 不变,陷入死循环)。因此当 right = mid 时,要向下取整。
寻找右边界思路: 寻找右边界时注意到右边界的特点:
- 左边区间(包括右边界)[left, resRight] 都是小于等于 x 的;
- 右边区间 [resRight + 1, right] 都是大于 x 的。
关于 mid 的落点,分为两种情况:
- 当 mid 落在 [left, resRight] 区间的时候,说明 [left, mid - 1](mid 不可以舍去,因为有可能是最终结果)都是可以舍去的,此时更新 left 到 mid 的位置;
- 当 mid 落在 [resRight + 1, right] 的区间的时候,说明 [mid, right] 内的元素是可以舍去的,此时更新 right 到 mid - 1 的位置。
由此,就可以通过二分来快速寻找右边界。 注意:这里找中间元素需要向上取整。因为后续移动左右指针的时候,左指针 left = mid 可能会原地踏步(例如剩下 1, 2 两个元素,left=1, right=2, mid=1。若向下取整则 mid=1,更新后 left,right,mid 不变,陷入死循环)。因此当 left = mid 时,要向上取整。
C++ 算法代码:
class Solution {
public:
vector<int> searchRange(vector<int>& nums, int target) {
int begin = 0, end = 0, mid = 0;
if (nums.empty()) {
return {-1, -1};
}
// 1. 查找区间左端点
int left = 0, right = nums.size() - 1;
while (left < right) {
mid = left + (right - left) / 2;
if (nums[mid] < target)
left = mid + 1;
else
right = mid;
}
if (nums[left] == target)
begin = left;
else
return {-1, -1};
// 2. 查找区间右端点
left = 0, right = nums.size() - 1;
while (left < right) {
mid = left + (right - left + 1) / 2; // 向上取整
if (nums[mid] <= target)
left = mid;
else
right = mid - 1;
}
if (nums[right] == target)
end = right;
else
return {-1, -1};
return {begin, end};
}
};
总结
本文讲解了二分查找的基础应用及变体,重点在于处理边界条件和避免死循环。掌握左右边界的收缩逻辑是解决此类问题的关键。


